به گزارش خبرگزاري كتاب ايران (ايبنا) ـ دكتر سيدمهدي طاهري در كارگاه آموزشي با عنوان «خردههاي غني(Rich snippets): دادههاي خرد (Microdata)، قالبهاي خرد (Microformats)و چارچوب توصيف منبع» كه صبح امروز (12 اردیبهشتماه) در سومین روز نمایشگاه بینالمللی کتاب تهران برگزار شد اظهار كرد: از آنجا كه صفات و ويژگيهاي هر شيء محتوايي (ورودي) در قالب استانداردها بهصورت معنادار توصيف شده يا به عبارت ديگر پردازش شده و در قالب محصول به شيوه اطلاعات پردازش شده و خدماتي جديد بازنمون میشوند ميتوان از فرادادهها استفاده كرد.
این کارشناس رایانه با بيان اينكه فرداده نيز يك نظام اطلاعاتي است افزود: ميانكنشپذيري نظامهاي فرادادهاي در هر دو سطح نحوي و معنايي رخ ميدهد. تلاشهايي كاربردي گسترده براي تسهيل فرايند ميانكنشپذيري نظامهاي فرادادهاي و موتورهاي كاوش در راستاي افزايش سطح دسترسپذيري به اشياي محتوايي انجام ميشود.
طاهری ادامه داد: همچنين ميانكنشپذيري نظامهاي فرادادهاي و موتورهاي وب از افزايش نمايهپذيري و پيدانمايي اشياي محتوايي توسط موتورهاي كاوش وب عبارت است و فرايند ميانكنشپذيري در دامنه فرادادهها، فرانماها، مخازن اطلاعاتي و و پيشينههاي فرادادهاي انجام ميشود.
ثبت فرادادهها و پروفایلهای کاربردی در اجرای میانکنشپذیری
اين مدرس دانشگاه با توضيح بيشتر پيرامون مفهوم ميانكنشپذيري گفت: محصول سطح فرانما يا تمركز بر عناصر و يا فرانماهاي جديد و ثبت فرادادهها و پروفايلهاي كاربردي و همچنين سطح پيشينهها با هدف همخواني عناصر براي فرايند تبديل پيشينهها از جمله اموري است كه در ميانكنشپذيري اجرا ميشود.
وي با ارايه اين توضيحات به مبحث اصلي نشست كه در خصوص دادههاي خرد، قالبهاي خرد و چارچوب توصيف منبع بود، پرداخت و در ادامه پيشينه تاريخي از گروه كاري فناوري كاربردي فرامتن وب ارايه کرد. طاهري در اینباره توضیح داد: در اين پيشينه گروهي از افراد علاقهمند به رشد و توسعه زبان نشانهگذاري فرامتن و فناوري مرتبط باز شركتهاي اپل، بنياد موزيلا و نرمافزار اپرا بيان شده است.
ایجاد دادههای خرد در پاسخ به رشد استاندارهای کنسرسیوم وب
اين كارشناس امور رايانه افزود: در اين پيشينه آمده است كه دادههاي خرد به منظور پاسخ به رشد آهسته استانداردهاي كنسرسيوم وب و تصميم آن در رها کردن «اچ.تي.ام.ال» به نفع «ايكس.ام.ال» به وجود آمد.
طاهري گفت: در آوريل 2007 ميلادي بهعنوان گام نخست، نسخه « اچ.تي.ام.ال 5» را به كنسرسيوم وب پيشنهاد دادند و اکنون روي web, webform, microdata, webworkers applaciton كار ميكنند.
وي همچنين با اشاره به پيشينه تاريخي گسترشهاي ساده هستيشناسي «اچ.تي.ام.ال» تشریح کرد: مجموعهاي كوچك از گسترشهاي «اچ.تي.ام.ال» كه براي معنابخشي به صفحات وب با استفاده از class, subclass, property طراحي شده است.
نشانهگذاري «اچ.تي.ام.ال» براي تقويت بعد معنايي اطلاعات وب
مدرس کارگاه آموزشی «خردههاي غني: دادههاي خرد، قالبهاي خرد و چارچوب توصيف منبع» در ادامه اظهار كرد: استفاده از نشانهگذاري «اچ.تي.ام.ال» براي تقويت بعد معنايي اطلاعات وب بيش از ويژگيهاي نمايشي و ارايه اطلاعات و همچنين پشتيباني ويژگيهاي معناشناختي «اچ.تي.ام.ال» توسط تمامي مرورگرهاي وب از جمله مواردي است كه براي گذشته «اچ.تي.ام.ال» ميتوان بيان كرد.
به گفته اين مدرس دانشگاه در سال 2001 ميلادي تيم برترز، لي (مخترع وب) موضوع وب معنايي را مطرح و بر تفاوت شيوههاي ارايه و بازنمون محتواي وب تاكيد كرد. در حقيقت تاكيد «اچ.تي.ام.ال» بيشتر بر ساختار درختي در باز نمون محتوا و افزايش ربط و افزايش دسترسپذيري به اشياي محتوايي وب خواهد بود.
طاهري، « div» و « span » را از زيرمجموعههاي « class » عنوان كرد و در ادامه به توضيح دادههاي خرد پرداخت. وي گفت: يكي از استانداردهاي تهيه شده توسط «whatwg» كه براي لانهسازي فرادادهها درون صفحات وب استفاده ميشود دادههاي خرد است.
پردازش دادههای خرد صفحات با موتورهای کاوش و وب
وی اظهار كرد: در دادههاي خرد موتورهاي كاوش، مرورگرهاي وب و خزندههاي وب قادر هستند دادههاي خرد صفحات را استخراج و پردازش كنند و از آنها براي تقويت تجربه مرور وب بهرهمند شوند و همچنين اين دادهها باعث درك بهتر موتورهاي كاوش از محتواي صفحات و ارايه نتايج مرتبطتر به كاربران ميشوند.
اين مدرس دانشگاه ادامه داد: دادههاي خرد از يك واژگان قابل گسترش و اختصاص جفتهاي نام-ارزش به خصايص يك شيء براي توصيف آن شيء استفاده ميكند و در حقيقت روشي سادهتر براي تفسير عناصر «اچ.تي.ام.ال» با برچسبهايي ماشينخوان نسبت به ميكروفرمت است.
وي با اشاره به بخشي از خصوصيتهاي دادههاي خرد گفت: گزينههايي مانند آيتم تايپ، آيتم پروپ، آيتم كد از خصوصيتهايي هستند كه براي ايجاد شيء و نشاندادن عناصر فرعي اين عنصر يا حتي ايجاد شناساگر منحصر به فرد شيء يا استفاده از شناسگر جهاني منبع واژگاني كه براي توليد واژههاي خود به حساب میآید است.
طاهري به نمونهاي از الگوهاي دادههاي خرد اشاره كرد و افزود: نمونهاي از اين الگو (Schematorg) است كه مجموعهاي از واژگانهاي به اشتراكگذاشته در آن قرار دارد كه براي مديران وبسايتها امكان نشانهگذاري صفحات وب را به نحوي كه براي موتورهاي كاوش قابل فهم باشد، فراهم ميكند. به گفته اين وی دانشگاه اين الگو طيف گستردهاي از اشيا را پشتيباني ميكند.
رويكردي مبتني بر وب براي نشانهگذاري معنايي
این مدرس دانشگاه در ادامه در تشریح قالبهاي خرد بیان كرد: این مفهوم رويكردي مبتني بر وب براي نشانهگذاري معنايي است كه از برچسبهاي «اچ.تي.ام.ال» و «ايكس.تي.ام.ال» براي درج فرادادهها در صفحات وب و ديگر منابعي كه اين قالب را پشتيباني ميكند، بهره ميگيرد.
وي ادامه داد: قالبهاي خرد، بستر را براي پردازش خودكار صفحات وب توسط عوامل وب مختلف فراهم ميكند كه اين مساله از سال 2010 ميلادي توصيف طبقي از اشياي محتوايي را امكانپذير كرده است. همچنين برخي از الگوهاي پذيرفته شده در آن مانند «اچ.كارد» بيش از دادههاي خرد استفاده شدهاند.
مدرس این کارگاه آموزشی در تشريح چارچوب توصيف منبع نيز گفت: يكي از استانداردهاي كنسرسيوم وب كه مجموعهاي از گسترشها سطح خصيصه را درج فرادادههاي غني در اشياي محتوايي وب ارايه ميدهد، چارچوب توصيف منبع است. در اين چارچوب ميتوان از سهگانههاي نهاد، گزاره و مفعول را كه با مخفف (آر.دي.اف) جاسازي كرده است، نام برد.
وي با اشاره به مزاياي چارچوب توصيف منبع عنوان کرد: از جمله اين مزايا ميتوان به خودنگهداري، رشدپذيري، استفاده مجدد از داده، پيمانهاي بودن فرانما و مواردي از اين قبيل نام برد.
طاهري با توضيح اين سه مبحث، به نحوه حمايت موتورهاي كاوش وب از اين خردههاي غني اشاره كرد و افزود: بهعنوان سادهترين مثال ميتوان از موتور جستجوگر گوگل نام برد كه در اين موتور جستجو فرادادهها به ارتقاي خردهها در نتايج گوگل كمك ميكند و خردهها عبارتند از تعداد محدودي از خطهاي متني با قابليت فراپيوند كه در بين نتايج جستجو پديدار به كاربرد كمك ميكنند تا محتواي صفحات و مرتبطترين اطلاعات با نياز خود را تشخيص دهد.
گوگل به دنبال تولید خردههای غنی برای یافتن وب
این مدرس دانشگاه عنوان كرد: اگر گوگل بتواند محتواي صفحات وب را بفهمد خردههاي غني توليد ميكند كه براي يافتن اطلاعات مرتبط و مناسب توسط كاربران مفيد است و همچنين باعث افزايش كليكهاي يك صفحه ميشوند. بهعنوان مثال خردههاي غني براي يك رستوران و يا براي يك آلبوم موسيقي كه اطلاعات آن در حاشيه ميآيد.
طاهري با بيان اينكه كدام روش براي كاربر مناسبتر است، اذعان كرد: با نگاهي به خرده دادههاي موجود در موتور جستجو ميتوان به اين نكته پي برد كه با استفاده از يك موتور جستجو ساختار وبسايت يك فرد به طور متناوب تغيير ميكند و امكان نشانهگذاري تمامي انواع اشياي محتوايي فرد به صورت منسجم وجود دارد و اگر ميخواهيد كنترل آشكار بر روي اينكه چگونه گوگل انواع اشياي محتوايي وب سايت شما را ميفهمد ميتوانيد از روش اچ.تي.ام.ال ماركآپ استفاده كنيد.
اين مدرس دانشگاه افزود: همچنين اگر كاربر قصد دارد محتواي وبسايت خود را درباره رخدادها تهيه كند يا هنوز براي به روزرساني نشانهگذاري وبسايت خود آمادگي و دانشي ندارند و يا اينكه ترجيح ميدهند به جاي نوشتن كدهاي نشانهگذاري اشاره و كليك كنند. ميتوانند از روش «ديتا هايلايتر» استفاده كنند.
خردهها برای موتورهای کاوش جذابترند
وی در پایان این کارگاه آموزشی با اشاره به نقاط قوت خردههاي غني در مقايسه با استانداردهاي فرادادهاي گفت: اين خردهها براي موتورهاي كاوش جذابتر هستند و ايجاد آن براي غير متخصصان آسانتر است و بهبود بازيابي و نمايش در موتورهاي كاوش و عامهپسندتر بودن نسبت به استانداردهاي فردادهاي و امكان ارايه مستقيم در بخش وب مسترتولز موتورهاي كاوشگر از جمله نقاط قوت خردههاي غني هستند.
طاهری نقاط ضعف خردههاي غني را در مقايسه با استانداردهاي فرادادهاي اين چنين نام برد: فقط رويكرد جاسازي، فقط بستر «اچ.تي.ام.ال» محدوديت نوع شيء محتوايي، محدوديت تعداد و نوع عناصر و اينكه فقط ويژه اشياء محتوايي وب هستند.
جمعه ۱۲ اردیبهشت ۱۳۹۳ - ۱۴:۰۹
نظر شما