برای پردازش زبان طبیعی فارسی فعالیت ها و پروژه های بسیار زیادی انجام شده است. متاسفانه هنوز این تلاش ها نتیجهی کاملی نداشته است و زبان فارسی بر خلاف بیشتر زبان های مدرن به صورت کامل قابل پردازش نیست. عدم امکان پردازش کامل زبان فارسی باعث عدم وجود پیاده سازی فرامین صوتی فارسی در بسیاری از گجت ها و نرم افزارها شده است. تنها پیشرفتی که تا به حال موفق بوده است عرضه نرم افزار تجاری برای پردازش اعداد در زبان فارسی بوده است. در ادامه چند لینک مرتبط در خصوص پردازش زبان طبیعی (برای زبان فارسی) را فهرست کرده ام:
- پردازش متن و زبان طبیعی دانشکده برق و کامپیوتر دانشگاه تهران
- آزمایشگاه پردازش زبان طبیعی دانشگاه علم و صنعت ایران
- پایگاه داده های زبان فارسی
- هضم برای پردازش زبان فارسی در پایتون
- باز برای استخراج آزاد اطلاعات در زبان فارسی مبتنی بر بخش از دادههای روزنامه همشهری
- آزمایشگاه NLP دانشگاه شریف (متروکه)
- گروه پژوهشی پردازش صوت
- دستور زبان پارسی (نگارش آقای دکتر نوید فاضل)
- گروه پژوهشی دادگان
- داده های متنی مرتب شده زبان پارسی (Corpora)
- پارس خوان پروژه ای رایگان و منبع باز و خواننده متن فارسی است.
- فهرست منابع Association for Computational Linguistics برای زبان فارسی
- فهرست Persian NLP از آقای Jon Dehdari
- دادههای برچسب خورده بیجانخان
دیدگاهتان را بنویسید