به گزارش خبرگزاری کتاب ایران (ایبنا)، سامانه جستجوی تمام متن در اسناد آرشیوی، همراه با پیادهسازی استاندارد «ALTO» به همت اداره کل پردازش و منابع دیجیتالِ معاونت پژوهش و منابع دیجیتال سازمان در ۲ سال گذشته آماده شده و قرار است از نسخه آزمایشی این سامانه در تاریخ ۲۷ آبان ساعت ۹ در آرشیو ملّی ایران (ساختمان گنجینه) رونمایی شود.
این سامانه بهمنظور توسعه و متناسبسازی فناوری «OCR» برای اسناد حروفچینی شده قدیمی و معاصر، از زمان دوره پهلوی اول تا به امروز، طراحی شده است.
در سامانه جستجوی تماممتن در اسناد آرشیوی، علاوه بر استخراج متن از تصاویر اسکن شده، ساختار هر صفحه در قالب استاندارد «ALTO» که استانداری برای برچسبزنی ساختار عناصر و متون در هر صفحه است؛ تحلیل و استخراج میشود. به کمک این استاندارد هنگام جستجو، محل وقوع هرکلمه در متن، مشخص و نشانهگذاری شده و برای کاربر نمایش داده میشود.
به گزارش ایبنا؛ به نقل از روابط عمومی سازمان اسناد و کتابخانه ملّی ایران، همچنین موتور جستجوی سامانه دیجیتال سازمان اسناد و کتابخانه ملی ایران برای بهبود دقت در جستجوی متنی، توسعه پیدا کرده است تا قابلیت جستجوی کلمات مجاور در متن (Proximity Search) را فراهم کند. این قابلیت از ابتدای آذر ۱۴۰۲ در سامانه دیجیتال سازمان اسناد و کتابخانه ملی ایران قابل استفاده خواهد بود.
نظر شما