پنجشنبه ۴ اسفند ۱۴۰۱ - ۰۹:۰۰

«پردازش متن و گفتار فارسی» روانه بازار نشر شد

کتاب «پردازش متن و گفتار فارسی: مروری بر مبانی نظری و آخرین یافته‌های پژوهشی» توسط سازمان مطالعه و تدوین کتب دانشگاهی در علوم اسلامی و انسانی (سمت) منتشر شد.

به گزارش خبرگزاری کتاب ایران (ایبنا)، «پردازش متن و گفتار فارسی: مروری بر مبانی نظری و آخرین یافته‌های پژوهشی» با تحقیق و نگارش مهرنوش شمسی‌فرد عضو هیئت علمی دانشگاه شهید بهشتی و محمود بی‌جن‌خان عضو هیئت علمی دانشگاه تهران توسط سازمان مطالعه و تدوین کتب دانشگاهی در علوم اسلامی و انسانی (سمت) منتشر شد.

در جهان کنونی، هر روزه حجم زیادی از اطلاعات در قالب محتوای زبانی و مستندات متنی یا فایل‌های صوتیِ گفتاری بر بستر وب و فضای مجازی عرضه می‌شود و به کمک ماشین‌های هوشمند، پردازش شده در اختیار کاربران قرار می‌گیرد. تولید، مدیریت و به کارگیری این محتوا مستلزم بهره‌مندی از دانش و فناوری‌های مرتبط با پردازش زبان و گفتار است.

این کتاب به منظور ارائه گزارشی جامع و روزآمد از وضعیت پژوهشییِ جاری در حوزه پردازش متن و گفتار فارسی، به قلم جمعی از متخصصان این حوزه تدوین شده است.
کتاب دارای دو قسمت پردازش متن و پردازش گفتار است و هر قسمت با بخش مرور منابع و زیرساخت‌های داده‌ای آغاز می‌شود و پس از بررسی کارهای انجام‌شده در توسعه ابزارها و پردازش‌های پایه و میانی، به بخش کاربردهای سطح بالاتر ختم می‌شود. هر بخش شامل چند فصل است و هر فصل، به شکل یک مقاله مروری نوشته شده که ضمن مطالعه کارهای گذشته، به تحلیل وضعیت حال می‌پردازد و با بیان مسائل باز حوزه، دریچه‌ای به آینده می‌گشاید.

محتوای کتاب طیف گسترده‌ای از مطالب، از به کارگیری و تطبیق آخرین دستاوردهای جهانی این حوزه بر روی زبان و گفتار فارسی تا ابداع روش‌های خاص زبان فارسی و ازمبانی نظری تا نتایج کاربردی را پوشش می‌دهد. این کتاب می‌تواند منبع مناسبی برای تمام دانشجویان و محققانی باشد که در زمینه تولید منابع، ابزارها و برنامه‌های کاربردی در حوزه پردازش متن و گفتار فارسی، پژوهش و فعالیت می‌کنند.

این کتاب در شش فصل از جمله منابع و دادگان های متن محور و مدخل محور، ابزارها و پردازش‌های پایه و میانی متن، تحلیل لغوی، نحوی و معنایی متون، حوزه‌های کاربردی پردازش متن، منابع و ابزارهای پردازش گفتار، حوزه‌های کاربردی پردازش گفتار مطالبی را ارائه داده است.

بخش اول کتاب که به منابع زبانی و دادگان های متن محور و مدخل محور در پردازش متن اختصاص یافته، شامل پنج فصل است. فصل اول نگاهی کلی به منابع زبانی و پیکره‌های متنی و واژی دارد و جایی که به پیکره‌های مورد توجه در فصول دیگر می‌رسد صرفا به آنها ارجاع می‌دهد تا از تکرار مطالب پرهیز شود. در واقع فصل اول علاوه بر معرفی حوزه کار، خود پیوند دهنده فصول دیگر و درآمدی برای ورود به فصول دو تا پنج نیز هست. پنج فصل نخست به معرفی دادگان‌ها و منابع زبانی ای اختصاص داده شده‌اند که در ادامه کتاب در فصول مختلف مورد استفاده قرار می‌گیرند. معرفی و تشریح پیکرده های متنی و واژی زبان فارسی که با نشانه‌های صرفی، نحوی سازه‌ای و وابستگی، معنایی و گفتمانی غنی شده‌اند، در این فصول انجام شده است.

در بخش دوم، ابزارها و پردازش‌های پایه و میانی متن معرفی می‌شوند. پیش پردازش‌های پایه که عمدتا برای هر کاربردی از متن استفاده می‌شوند، مانند واحدسازی، هنجارسازی، تحلیل ساخت‌واژی، بن‌واژه‌یابی و ریشه‌یابی در فصل ششم مورد مطالعه قرار می‌گیرند. این فصل ضمن بیان مبانی نظری در این حوزه به بررسی و مقایسه ابزارهای پیش پردازش موجود برای زبان فارسی خواهد پرداخت.

فصول هفتم تا دوازدهم به میان ابزارها یا (پیش) پردازش‌های میانی اختصاص دارند. منظور از (پیش) پردازش‌های میانی پردازش‌هایی هستند که معمولا نه به عنوان یک کاربرد مستقل، بلکه به عنوان یک زیر وظیفه از وظایف یک برنامه کاربردی و در مراحل ابتدایی آن مورد استفاده قرار می‌گیرند، اما به اندازه پیش پردازش‌های پایه، ابتدایی و سطح پایین نیستند و الزاماً در مراحل اولیه همه کاربردها، نیازی به آنها نیست.

بازشناسی موجودیت‌های نامدار جهت شناسایی اسامی افراد، سازمان‌ها، مکان‌ها، زمان‌ها، و مانند آن در متن، بازشناسی همه مرجع‌ها به منظور تشخیص مرجع ضمایر و همچنین شناسایی کلمات مختلفی که در متن به یک موجودیت واحد اشاره دارند، شناسایی اصطلاحات چند کلمه‌ای برای شناسایی اصطلاحات چند کلمه‌ای برای شناسایی افعال و کلمات مرکب و چند واحدی و اصطلاحات و عبارات زبانی و در آخر رده بندی متون در این دسته قرار می‌گیرند. همچنین فرایندهایی مانند تعبیه کلمات و ساخت بردار جاسازی آنها در فضای برداری معنایی و استخراج مدل زبانی و همایندها نیز وظایفی هستند که در این بخش به آنها توجه می‌شود و برای بسیاری از کاربردهای ضروری اند.

در بخش سوم به تحلیل‌های لغوی، نحوی و معنایی متون پرداخته شده و فصولی در مورد خطایابی متن، تجزیه سازه‌ای و وابستگی جملات و معناشناسی رایانشی را دربرگرفته است. فصل سیزده که به خطایابی و استانداردسازی متون تخصیص یافته، به بررسی نظری و کاربردی خطایابی در زبان فارسی و معرفی و مقایسه سامانه‌های تهیه شده جهت ویرایش متون، استانداردسازی، خطایابی و اصلاح آنها می‌پردازد. فصول چهارده تا شانزده به تجزیه نحوی جملات فارسی اختصاص دارند و به ترتیب تجزیه سازه‌ای، تجزیه سطحی (چانکینگ) و تجزیه وابستگی زبان را مورد مطالعه قرار می‌دهند. بررسی مبانی نظری و الگوریتم‌های معرفی شده در سطح جهانی و نحوه انطباق آنها برای زبان فارسی از مباحث مورد بحث در این فصول هستند. در آخرین فصل از بخش سوم به تحلیل‌های معنایی پرداخته می‌شود و طیف وسیعی از مباحث مطرح در معناشناسی رایانشی از بازنمایی معنایی و رفع ابهام معنایی کلمات تا شباهت سنجی معنایی کلمات و جملات و بازنمایی معنای سازه‌های بزرگ‌تر از کلمه در دو حالت ترکیب پذیر و غیرترکیب پذیر را شامل می‌شود. مباحثی مثل دگرنویسی، شناسایی نقش‌های موضوعی، استلزامات متنی و شناسایی استعاره در این فصل مورد بحث قرار می‌گیرند.

در نهایت در بخش چهارم، شش مهارت تخصصی زبان در چارچوب شش حوزه کاربردی خلاصه سازی متن، مشابهت یابی و کشف تقلب، احساس کاوی، ترجمه ماشینی، سامانه‌های پرسش و پاسخ و سامانه‌های جستجوگر معرفی می‌شوند.

بخش پنجم و ششم به پردازش گفتار اختصاص دارد. در این قسمت نیز سیر حرکت از دادگان‌ها و منابع زبانی آغاز می‌شود و سپس ابزارهای پایه و میانی پردازش گفتار فارسی معرفی می‌شوند و در نهایت کاربردها معرفی خواهند شد. بنابراین بخش پنجم به معرفی پیکره‌ها و ابزارهای پایه پردازش گفتار فارسی اختصاص یافته است و سرانجام در بخش ششم فصول ۲۶ تا ۲۹ پردازش‌های میانی در حوزه گفتار (که البته در اینجا خود می‌توانند کاربرد نهایی نیز باشند) مانند تبدیل گفتار به متن، تبدیل متن به گفتار، بازیابی اطلاعات گفتاری و بازشناسی گفتاری معرفی می‌شوند و در فصل آخر به چند مهارت تخصصی گفتاری زبان فارسی در چارچوب برنامه‌های کاربردی پردازش گفتار پرداخته می‌شود.

انتشارات سمت این کتاب را با قیمت ۳۹۳ هزار تومان عرضه کرده است.

لینک کوتاه

نظر شما

شما در حال پاسخ به نظر «» هستید.

نام

ایمیل

نظر شما *

برگزیده

از تازه‌های نشر سازمان اسناد و کتابخانه ملی ایران ؛

«روایت سعادت» اثری جدید از مجموعه تاریخ شفاهی

کتاب «روایت سعادت»، اثر جدید از مجموعه تاریخ شفاهی سازمان اسناد و کتابخانه ملی ایران، به تازگی منتشر شد.
به مدت ۲ روز؛

تعطیلی موزه‌های تهران در پی آلودگی هوای پایتخت

موزه‌ها و اماکن فرهنگی‌تاریخی پایتخت در پی آلودگی هوای تهران به مدت ۲ روز تعطیل شدند.
همزمان با زادروز احمد شاملو؛

نمایشگاه «ابدیتی از تو» از ۲۳ آذر در خانه هنرمندان ایران

نمایشگاه آثار خط برجسته «ابدیتی از تو» به مناسبت زادروز احمد شاملو با عنوان «ابدیتی از تو» در خانه هنرمندان ایران برپا می‌شود.
به کوشش دبیرخانه پویش؛

داوری پویش ملی دانش‌آموزی «برسد به دست سیدحسن» آغاز شد

مرحله داوری پویش ملی دانش‌آموزی «برسد به دست سیدحسن» با بررسی بیش از هزار و ۲۰۰ اثر از سراسر کشور انجام می‌شود.
روزهای سرد دهه ۱۳۲۰ شمسی به روایت یک کتاب؛

بررسی رمان «مه و دود» در فرهنگسرای گلستان

فرهنگسرای گلستان در اولین نشست از سلسله نشست‌های «کتاب نوش» به معرفی و مرور کتاب «مه و دود» می‌پردازد.
از سوی کانون پرورش فکری؛

کارگاه شاخص‌های بصری در کتاب‌های کودک و نوجوان برگزار می‌شود

کانون پرورش فکری کودکان و نوجوانان، کارگاه دو روزه‌ای با عنوان «آشنایی با شاخص‌های بصری در ارزیابی کتاب‌های کودک و نوجوان» برگزار می‌کند.
مدیر بخش مسابقه تبلیغات سینمای ایران جشنواره فیلم فجر اعلام کرد؛

استقبال از بخش مسابقه تبلیغات سینمای ایران فجر چهل‌وسوم

با پایان مهلت ارسال آثار به مسابقه تبلیغات سینمای ایران چهل‌وسومین جشنواره فیلم فجر، مدیر این بخش، تعداد آثار ارسال‌شده را اعلام کرد.
به همت انتشارات کتابسرای میردشتی؛

کتاب «طراحی در معماری شهری» منتشر شد

کتاب «طراحی در معماری شهری؛ تابلوهای اطلاع رسان و هدایت‌کننده مکان‌های شهری و عمومی» نوشته سید مهدی نورانی در نوبت اول ۱۴۰۳ یا ۳۴۴ صفحه و قیمت ۶۸۵ هزار تومان به همت انتشارات کتابسرای میردشتی منتشر شده است.
توسط دفتر ادبیات مرکز آفرینش‌های ادبی حوزه هنری؛

کتاب «جاده کالیفرنیا» رونمایی می‌شود

کتاب «جاده کالیفرنیا» روز سه شنبه ۲۰ آذر در موزه صلح تهران نقد و بررسی می‌شود.
از سوی امیرکبیر؛

انتشار مجدد دوره هفت‌جلدی «آتش بدون دود» انجام شد

انتشارات امیرکبیر به تازگی مجموعه ۷ جلدی آتش بدون دود، اثر نادر ابراهیمی را دوباره منتشر و روانه بازار نشر کرده است
توسط نشر کامک؛

«محیط کار انسانی» وارد بازار نشر شد

کتاب «محیط کار انسانی؛ بالندگی کارکنان و کسب و کار؛ از طریق خلق جو کاری انسان محور» توسط انتشارات کامک، رهسپار بازار نشر شد.
گپ‌وگفت با یک تصویرگر کتاب کودک در «سه‌شنبه‌های طلایی»؛

دورهمی تصویرگران در کارستان بهارستان

سلسله نشست‌های «سه‌شنبه‌های طلایی» در این هفته مهمان سمیه محمدی، تصویرگر کتاب کودک خواهد بود.
به همت خانه هنرمندان ایران؛

نشست تخصصی حقوقی در خصوص سکوهای نمایش خانگی

نشست تخصصی «به کسی مربوط نیست؟!» سه‌شنبه ۲۰ آذر ۱۴۰۳ در خانه هنرمندان ایران برگزار می‌شود.
از سوی انتشارات نگارستان اندیشه؛

کتاب «سیاست» فرهنگ رجایی رونمایی می‌شود

مراسم رونمایی از کتاب «سیاست» از سوی انتشارات نگارستان اندیشه با همکاری مرکز مطالعات استراتژیک خاورمیانه برگزار می‌شود.
در خانه دکتر شریعتی؛

یاد خلبان اسکندری در خانه دکتر شریعتی می‌پیچد

نشست نقد و بررسی کتاب «بیگانه با ترس» (هشت گفتگو درباره خلبان محمود اسکندری) در خانه‌موزه دکتر شریعتی برگزار می‌شود.
بنیاد سعدی خبر داد؛

دیدار استادان زبان فارسی با حداد عادل در ایروان / پل ادبی میان ایران و ارمنستان

دیدار نخبگان زبان و ادبیات فارسی ارمنستان با دکتر غلامعلی حداد عادل؛ رئیس بنیاد سعدی در سفارت جمهوری اسلامی ایران برگزار شد.
از سوی خانه اندیشمندان علوم انسانی؛

نشست «تحلیل ژئوپلیتیکی تحولات سوریه» برگزار می‌شود

نشست «تحلیل ژئوپلیتیکی تحولات سوریه و رویکرد بازیگران منطقه‌ای و فرامنطقه‌ای» در سالن خیام خانه اندیشمندان علوم انسانی برگزار می‌شود.
توسط انتشارات امیرکبیر؛

شازده کوچولو به چاپ هشتاد و دوم رسید

کتاب شازده کوچولو اثر آنتوان دوسنت اگزوپری با ترجمه محمد قاضی توسط انتشارات امیرکبیر به چاپ هشتاد و دوم رسید.
از سوی انتشارات انقلاب اسلامی؛

دو عنوان از مجموعه‌ی ره‌نامه به چاپ سوّم رسیدند

کتاب‌های «زن و خانواده» و «رسانه و فضای مجازی» از مجموعه‌ی ۴۰ جلدی «ره‌نامه» تجدید چاپ شده و به چاپ سوّم رسیدند.
از سوی موسسه شهرستان ادب؛

«ماه و بلوط» محسن مومنی شریف در شهرستان ادب نقد می‌شود

دفتر داستان شهرستان ادب در نهمین برنامه از «عصر اثر» رمان «ماه و بلوط» نوشته محسن مومنی شریف را نقد و بررسی می‌کند.

پربازدیدترین

تازه‌ها

کارگردان مستند «بوم ایرانی» مطرح کرد؛

«بوم ایرانی»؛ مستندی از دنیای کتاب‌ها

محمد مقدم گفت: علی پارسا نتیجه تحقیقات ۵ ساله خود را در کتابی به نام «بادبان‌های جنوب» منتشر کرده است. با حمایت و اصرارهای او، «بوم ایرانی» را براساس «بادبان‌های جنوب» ساختم.
مسابقه فیلمنامه‌نویسی؛

«تصویر شهر تهران» برگزار می‌شود

مؤسسه تصویر شهر با هدف حمایت از ایده‌های برتر برای تولید آثار سینمایی، مسابقه فیلمنامه‌نویسی با عنوان «تصویر شهر تهران» را برگزار می‌کند.
به همت انتشارات آبان؛

مجموعه ۱۰ جلدی «اکفراسیس» منتشر شد

مجموعه ۱۰ جلدی «اکفراسیس» با رویکردهایی متنوع مانند نامه‌نگاری، یادداشت، روایت و معرفی آثار، به بررسی و تفسیر هنر پرداخته و هر جلد آن، چشم‌اندازی تازه به دنیای هنر و ادبیات ارائه می‌دهد.
نویسنده کتاب «انین الاقصی» در گفت‌وگو با ایبنا؛

غسان با قلمش برای اسرائیل از یک گردان چریکی خطرناک‌تر بود

فداء الزمر، برگزیده اولین دوره جایزه جهانی ادبیات فلسطین،گفت:روایت فلسطینی باید حفظ شود چر که آثار ادبی محرک و برانگیزاننده جنبش‌های انقلابی علیه اشغالگری بودند همان طور که گولدامایر گفته است:«با کشتن غسان، از یک لوای فکری مسلح که برای اسرائیل خطرناک‌تر از هزار فدایی مسلح بود خلاص شدیم؛ زیرا غسان با قلمش برای اسرائیل از یک گردان چریکی خطرناک‌تر بود.»
در دورهمی حافظ خوانی اراک روایت شد؛

سالک از راه و رسم منزل‌ها بی‌خبر نبود

مرکزی – سه‌شنبه دیگر فرا رسید و دورهمی حافظ خوانی در اراک تفأل بر غزل شماره یک حافظ برای خوانش و تفسیر و تعبیر برآمد تا پیر مغان روایت کند «چگونه عشق آسان نمود اول ولی عاقبت چه مشکل‌ها را رقم زد.».
به همت انتشارات «پَر سُرخ»؛

«سندباد در سیریک» منتشر شد

هرمزگان - به همت انتشارات «پَر سُرخ»، کتاب «سندباد در سیریک» منتشر شد.
در حوزه هنری اصفهان؛

«دختری که پروانه شد» نقد و بررسی شد/ داستان به‌مثابه تخیل شفابخش

اصفهان - هشتمین نشست جمع‌خوانی کتاب‌های کودک و نوجوان با محوریت کتاب «دختری که پروانه شد» در حوزه هنری اصفهان برگزار شد.
به مناسبت ۲۱ آذرماه سالروز درگذشت میرزا حسن رشدیه؛

«پیر معارف»؛ نامی که «پدر فرهنگ نوین ایران» با آن امضا می‌کرد/ مؤسس اولین دبستان در ایران

سیدرضا باقریان موحد، رشدیه‌پژوه گفت: اگرچه از رشدیه با القابی چون «پدر آموزش و پرورش نوین ایران»، «بنیانگذار آموزش و پرورش نوین ایران»،«پدر فرهنگ نوین ایران»،«پدر مدارس جدیده در ایران»، «مؤسس اولین دبستان در ایران» و... یاد می‌شود، ولی لقب و عنوانی که خود رشدیه دوست داشت و همیشه با این عنوان امضا می‌کرد، «پیر معارف» بود.
فیلم

نگاهی به ردپای استعمار در تاریخ ایران

معرفی کتاب «جوانه های آتش» اثر مهدی میرکیایی از انتشارات سوره مهر توسط زینب زارع را مشاهده می‌کنید.
افق منتشر کرد؛

«رگ و ریشه»؛ وقتی خانواده همه چیز است

این رمان که در سال ۱۹۷۷ منتشر شد، سفری بی‌مانند به تاروپود مفهوم خانواده، میراث فرهنگی و تقلایی همه‌گیر برای معنابخشی به زندگی در مواجهه با مرگ است. سبک نیمه‌زندگی‌نامه‌ای فانته، اصالت و عمق احساسی ویژه‌ای به این داستان می‌بخشد و آن را به خوانشی تأثیرگذار برای هر کسی که به دنبال درک پیچیدگی‌های زندگی است، تبدیل می‌کند.
چهارشنبه‌ها با کتاب‌های امام‌رضایی - ۳

آینه‌ای از معنویت و عشق در «گل‌های این باغ»

خراسان‌رضوی - کتاب «گل‌های این باغ» مجموعه داستان‌ کوتاهی درباره امام رضا (ع) و شهدا است که آینه‌ای از معنویت و عشق است.
فیلم

لذت واقعی نویسندگی از نوشتن برای دیگران آغاز می‌شود

معرفی کتاب «رنجین کمان» اثر غلامرضا طریقی را در برنامه کتاب یک مشاهده می‌کنید.
از تازه‌های نشر سازمان اسناد و کتابخانه ملی ایران ؛

«روایت سعادت» اثری جدید از مجموعه تاریخ شفاهی

کتاب «روایت سعادت»، اثر جدید از مجموعه تاریخ شفاهی سازمان اسناد و کتابخانه ملی ایران، به تازگی منتشر شد.
در خانه فرهنگ ایران در حیدرآباد؛

ترجمه سندی «تاریخ و جغرافیای تصوف» رونمایی شد

مراسم رونمایی از ترجمه سندی کتاب «تاریخ و جغرافیای تصوف» با حضور مترجم کتاب، اساتید دانشگاه و دوستداران کتاب و حوزه فرهنگ در خانه فرهنگ جمهوری اسلامی ایران در حیدرآباد برگزار شد.
گفت‌وگوی ایبنا با بنیان‌گذار استودیو «کمیکا»؛

هزینه تولید حرفه‌‎ای هر کتاب کمیک ۷۰۰ میلیون تومان است

محمدمهدی جلالیان، بنیان‌گذار استودیو «کمیکا»، نویسندگی و طراحی کتاب کمیک را مهمترین بخش هزینه ۷۰۰ میلیونی تا ۱ میلیاردی، ناشر حرفه‌ای این نوع کتاب در ایران می‌داند.
در تالار مرکزی رشت؛

کتاب «خوشنویسان گیلان» در رشت رونمایی شد

گیلان -کتاب خوشنویسان گیلان (معاصر) تألیف آمنه اکبرزاده در جمع هنردوستان و علاقمندان در تالار مرکزی رشت رونمایی شد.
به مدت ۲ روز؛

تعطیلی موزه‌های تهران در پی آلودگی هوای پایتخت

موزه‌ها و اماکن فرهنگی‌تاریخی پایتخت در پی آلودگی هوای تهران به مدت ۲ روز تعطیل شدند.
روزهای چهارشنبه و پنج‌شنبه؛

کتابخانه ملی باز است

تالارهای تخصصی و عمومی سازمان، با وجود تعطیلی شهر تهران به دلیل آلودگی هوا، طبق روال معمول دایر و آماده ارائه خدمات به مراجعان هستند.
به دلیل خدمات علمی و فرهنگی در حوزه مولوی‌شناسی؛

رایزن فرهنگی هندوستان برگزیده جایزه مولانا شد

بلرام شکلا، رئیس مرکز فرهنگی سوامی ویوکانندا به‌ پاس خدمات علمی و فرهنگی در حوزه مولوی‌شناسی، برگزیده بخش بین‌الملل جایزه مولانا شد.
گزارش تصویری

دورهمی تصویرگران در کارستان بهارستان

سلسله نشست‌های تصویرگری و طراحی گرافیک کتاب با عنوان «سه‌شنبه‌های طلایی» عصر امروز با حضور سمیه محمدی تصویرگر کتاب کودک در کارستان بهارستان برگزار شد. /عکاس:معصومه احمدی