یکشنبه ۹ مهر ۱۴۰۲ - ۱۰:۲۰
وجود 4 میلیون اثر دیجیتال‌ شده در کتابخانه ملی/بهره‌مندی از هوش مصنوعی در فهرست‌نویسی

مدیرکل پردازش منابع و فناوری‌های دیجیتال کتابخانه ملی ایران گفت: بیش از چهار و نیم میلیون اثر دیجیتال‌شده در کتابخانه ملی داریم که 2 میلیون و 300 هزار اثر، آنلاین دسترس‌پذیر است.

علیرضا انتهائی در گفت‌و گو با خبرنگار خبرگزاری کتاب ایران(ایبنا)، درباره پیشرفت دیجیتال‌سازی منابع سازمان اسناد و کتابخانه ملی ایران در دوره اخیر گفت: در مجموع بیش از چهار و نیم میلیون اثر دیجیتال‌شده در کتابخانه ملی داریم که 2 میلیون و 300 هزار اثر، آنلاین دسترس‌پذیر است. این منابع شامل اسناد و پرونده‌های آرشیوی، کتاب‌های خطی و نفیس، نشریات عمومی و علمی، کتاب‌های کودکان و نوجوانان و منابع غیرکتابی مانند عکس‌ها، نقشه‌ها و  پایان نامه‌ها است.

وی با بیان اینکه درصد قابل توجهی از کتاب‌های خطی، دیجیتال‌سازی شده است، گفت: همچنین 120 هزار پرونده آرشیوی سندی و  36 هزار نسخه خطی و سنگی نیز دیجیتال‌سازی شدند و 14 هزار کتاب نفیس، حدود 70 هزار عکس و 350 هزار پایان‌نامه، 580 هزار شماره نشریه عمومی و تاریخی و 900 هزار مقاله علمی نیز اکنون از طریق سامانه‌های سازمان، آنلاین در دسترس قرار دارند.  
  
مدیرکل پردازش منابع و فناوری‌های دیجیتال سازمان اسناد و کتابخانه ملی ایران با بیان اینکه هم‌اکنون بسیاری از مقالات و نشریات، آنلاین و خودکار از وبگاه نشریات یا سامانه رسانه‌های کشور وزارت فرهنگ و ارشاد اسلامی دریافت می‌شوند که به این منابع دیجیتال‌زاد می‌گویند، گفت: براساس تفاهم‌نامه‌ای که سازمان اسناد و کتابخانه ملی با وزارت فرهنگ و ارشاد اسلامی منعقد کرده است، روزنامه‌ها و نشریات ثبت شده در آن سامانه، به شکل مستقیم دریافت می‌شوند.
 
انتهائی درباره ارائه کمّیت خدمات دیجیتال به پژوهشگران در طول دو سال و نیم گذشته اظهار کرد: درحال حاضر نزدیک به 100 هزار بازدیدکننده یکتا در ماه داریم که از سامانه‌های مختلف و وبگاه سازمان اسناد و کتابخانه ملی استفاده می‌کنند و ممکن است این افراد لزوما عضو کتابخانه ملی نباشند زیرا برخی دسترسی‌‌ها مانند نسخ خطی و موجود در سامانه‌های دیجیتال کتابخانه ملی دسترسی رایگان و عمومی دارند.
 
مدیرکل پردازش منابع و فناوری‌های دیجیتال سازمان اسناد و کتابخانه ملی ایران با اشاره به تدوین سامانه یکپارچه دیجیتال برای خدمت‌رسانی بهتر به کاربران گفت: برنامه‌ریزی برای طراحی و مطالعات اولیه این سامانه انجام شده است و بهبود خدمات و کیفیت استفاده، ویژگی مهم این سامانه برای مخاطبان خواهد بود؛ البته طراحی این سامانه نیازمند تامین اعتبار و نیروی انسانی است و اجرای این سامانه از زمان طراحی آن دوسال زمان می‌برد.
 
حضور پررنگ تر در فضای مجازی

انتهائی درباره تحول دیجیتال در دوره جدید گفت: آنچه در طول این دو سال و نیم رخ داده این است که  حضور سازمان اسناد و کتابخانه ملی ایران در فضای مجازی( آنلاین) افزایش پیدا کرده؛ مثلا در بخش سامانه نشریات ایران‌(سنا) شاید بتوان گفت، سامانه کتابخانه ملی جزو نخستین سامانه‌هایی بود که به شکل سازمان‌یافته و استاندارد تلاش کرده نشریات دوره قاجار تاکنون را گردآوری و دسترس‌پذیر کند.

استفاده از هوش مصنوعی در سه حوزه

مدیرکل پردازش منابع و فناوری‌های دیجیتال سازمان اسناد و کتابخانه ملی ایران درباره استفاده از هوش مصنوعی در سامانه‌‌های دیجیتال کتابخانه ملی ایران اظهار کرد: بیش از دو سال و نیم است که درباره کاربرد هوش مصنوعی در سه حوزه تمرکز کردیم که شامل استخراج موضوع‌هاي اصلی و رده‌بندی کلی از کتاب‌ها، استخراج فراداده‌های توصیفی از درون منابع اطلاعاتی و شناسایی اجزای صفحات نشریات و روزنامه‌ها و تفکیک، OCR و استخراج عنوان و پددیدآورنده آن است.
 
وی با بیان اینکه سازمان اسناد و کتابخانه ملی ایران در استفاده از هوش مصنوعی برای شناسایی ماهیت اطلاعات و استخراج محتوای منابع فعالیت‌هایی را انجام داده است، اظهارکرد: کتابخانه ملی در سه بخش تبدیل تصاویراسکن شده به متن، بحث شناسایی اطلاعات و استخراج اطلاعات از متن کار خود را آغاز کرده است؛ همچنین با استفاده از هوش مصنوعی توانستیم در بحث استخراج اطلاعات از متن مانند استخراج کلیدواژه‌ها، موجودیت‌های نامدار(مانند نام اشخاص، تاریخ‌ها، رویدادها، سازمان‌ها و مانند آن) فعالیت‌هایی را پیش ببریم.
 
انتهائی با اشاره به نقش هوش مصنوعی در کتابخانه‌ها اظهار کرد: ‌نقش مهم هوش مصنوعی در کتابخانه‌ها این است که بتوانیم  در مبحث پردازش اطلاعات که بخش مهمی از فرایند  کتابخانه‌ها است، از این فناوری استفاده کنیم اما قطعا هوش مصنوعی نیاز به نظارت انسانی دارد. در این نظارت، به‌عنوان مثال مشخص می‌شود تا چه اندازه کلیدواژه‌های استخراج شده ازطریق سامانه هوش مصنوعی دقیق است و آن ناظر نیز می‌‌تواند در انتها اصلاحات را انجام دهد و این اتفاق و نظارت موجب می‌شود عامل‌های هوش مصنوعی در طول زمان بیشتر یادبگیرند و خودشان را اصلاح کنند.

 وارد‌شدن کتابخانه ملی به مبحث هوش مصنوعی

مدیرکل پردازش منابع و فناوری‌های دیجیتال سازمان اسناد و کتابخانه ملی ایران با تاکید بر اینکه سازمان اسناد و کتابخانه ملی در دوسال و نیم گذشته به استفاده عملی از هوش مصنوعی وارد شده و سازمان نیز از این بحث حمایت کرده است، عنوان کرد: سازمان اسناد و کتابخانه ملی ایران با کمک شرکت‌های دانش‌بنیان، تلاش کرده تا درباره مباحث مدیریت داده‌ها تمرکز کند و بتواند در بخش استخراج عناصر اطلاعاتی از متن و شناسایی ماهیت انواع منابع اطلاعاتی از طریق هوش مصنوعی قدم‌های موثری بردارد.  
 
وی با بیان اینکه کتابخانه ملی در استفاده از هوش مصنوعی وارد فاز عملیاتی شده و فاز تحقیقاتی و مطالعاتی این موضوع را پشت سر گذاشته شده است، عنوان کرد: اکنون در کتابخانه ملی با استفاده از هوش مصنوعی تلاش می‌کنیم دریابیم میزان دقت استخراج یک موضوع از یک کتاب چقدر است؟ برای مثال  30 صفحه نخست از یک کتاب را به کمک سامانه تحلیل کرده و رده‌بندی کنگره و موضوع کتاب را استخراج می‌کند، اما فرایند وارد شدن این فناوری به سامانه کتابخانه ملی زمانی محقق می‌شود که کارشناسان به سطح دقت قابل قبولی از هوش مصنوعی  اعتماد کنند، فرایند استقرار بگذرد و سپس این فناوری، فعال در سامانه‌های سازمان مورد استفاده قرار گیرد.
 
انتهائی با بیان اینکه در بحث استفاده از هوش مصنوعی دو پارامتر مهم را مدنظر قرار می‌دهیم، اظهار کرد: بحث دقت (Precision) و جامعیت (Recall) که در بازیابی اطلاعات برای بخش ساماندهی و پردازش اطلاعات بسیار مهم است، به‌عنوان مثال اگر از یک مقاله بتوانیم 20 کلیدواژه استخراج کنیم؛ این نکته که آیا هوش مصنوعی این 20 کلیدواژه را می‌تواند پیدا ‌کند به جامعیت مربوط می‌شود. و در مرحله بعد آیا این 20 کلیدواژه‌ای را  که پیدا کرده، صحیح هستند؟ که این مساله همان دقت است. به‌طور کلی  در بخش استفاده از جامعیت و دقت هوش مصنوعی بر روی سامانه‌های کتابخانه ملی در سه پروژه تعریف شده هوش مصنوعی تقریبا به اعداد 80 تا 90 درصد رسیده‌ایم؛ البته دقت هوش مصنوعی در متون قدیمی‌‌تر کمتر است.

 دسترس پذیر‌کردن و بالا‌بردن عمق دسترسی به اطلاعات

مدیرکل پردازش منابع و فناوری‌های دیجیتال سازمان اسناد و کتابخانه ملی ایران با بیان اینکه تمرکز بر روی استفاده از هوش مصنوعی برای استخراج اطلاعات از درون نشریات و مقالات یکی از اهداف این بخش است، عنوان کرد: دسترس پذیر کردن و بالا بردن عمق دسترسی به اطلاعات مساله ای است که کتابخانه ملی در بخش پردازش اطلاعات با استفاده از هوش مصنوعی آن را دنبال می‌کند.
 
وی افزود:در واقع آن بخش از کوه یخ اطلاعات که در بخش جست‌و‌جوهای گذشته مغفول می‌ماند، قرار است با استفاده از هوش مصنوعی دسترس‌پذیر شود. البته در حوزه استفاده از هوش مصنوعی باید محدودیت‌هایی مانند حق کپی رایت و حریم خصوصی را رعایت کنیم. استفاده از هوش مصنوعی می‌تواند در بخش برچسب‌گذاری‌ عکس‌ها، اسناد و مشابهت یابی در منابع کمک کند و کتابخانه ملی در این حوزه‌ها فعالیت خود را آغاز کرده است.
 
انتهائی درباره خدمات دیگر هوش مصنوعی افزود: هوش مصنوعی می‌تواند زمینه‌های انجام فهرست‌نویسی هوشمند را نیز فراهم ‌کند و یکی از پروژه‌های کتابخانه ملی دنبال کردن همین مساله است. این سامانه به‌عنوان دستیار به فهرست‌نویس کمک می‌کند منابع سریع‌تر فهرست شوند. این اتفاق می‌تواند در زمینه‌های صدور فیپا، فاپا و .. عملیاتی شود. بهره‌مندی از هوش مصنوعی در فهرست‌نویسی

مدیرکل پردازش منابع و فناوری‌های دیجیتال سازمان اسناد و کتابخانه ملی ایران درباره تفاوت استفاده از هوش مصنوعی برای استخراج محتوا از کتاب و سایر منابع اطلاعاتی گفت: استخراج اطلاعات از کتاب به کمک هوش مصنوعی به دلیل اینکه این منبع، موضوع مشخصی دارد و با فصل‌بندی مشخصی تنظیم شده است، نسبت به تحلیل محتوا در  روزنامه و نشریه که دارای انواع موضوعات مانند مقاله، خبریا عکس و آگهی است، راحت‌تر است زیرا در این حالت، فناوری هوش مصنوعی قبل از استخراج اطلاعات، باید ماهیت محتوا را شناسایی و از سایرین تفکیک کند.

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.

برگزیده

پربازدیدترین

تازه‌ها