این نرمافزار توسط شرکت دانشبنیان عصر گویشپرداز صبح امروز سهشنبه با حضور مسوول نهاد نمایندگی نماینده ولیفقیه در دانشگاه شریف رونمایی شد.این سامانه تمامی سخنرانیها، بیانات، فرمایشات، کلاسهای درس و ارشادات مقام معظم رهبری را از سال ۷۰ تاکنون به متن تبدیل کرده است.
سامانه تبدیل فایلهای صوتی سخنرانیهای مقام معظم رهبری با فناوری هوش مصنوعی و اختصاصی کردن موتور تشخیص گفتار، این امکان را فراهم کرده است که فایلهای صوتی و ویدئویی ضبط شده از فرمایشات رهبر انقلاب به صورت متن دربیاید.
این نرمافزار نسل دوم تکنولوژی تایپ گفتاری فارسی محسوب میشود که با بهرهگیری از تجارب به کار گرفته شده در تکنولوژی شرکتهایی مانند گوگل، مایکروسافت و آمازون، بومیسازی و پیادهسازی شده است.
موتور این نرمافزار توسط نخبگان دانشگاه شریف و جمعی از هیات علمی دانشگاه تهران راهاندازی شده است.در این نرمافزار، محدودیتهایی چون عدم امکان تایپ محاورهای، عدم کیفیت صدای ورودی و نویز محیط نسبت به نرمافزار نسخه نخست رفع شده است.
سامانه تبدیل فایل صوتی به متن به صورت اختصاصی در فاز نخست برای بیانات مقام معظم رهبری رونمایی شده است و در فازهای بعدی این نرمافزار برای عموم کاربرد خواهد داشت.سخنرانیهای مقام معظم رهبری در ۲۳ سال گذشته در این نرمافزار با درجه کیفیت بیش از ۹۳ درصد به متن تبدیل شده است.
تحلیل محتوایی کلمات پرکاربرد از فرمایشات رهبری
هادی ویسی مدیرعامل شرکت عصر گویشپرداز در مراسم رونمایی از این نرم افزار با اشاره به اقدامات صورت گرفته برای طراحی نرمافزار تبدیل فایلهای صوتی فرمایشات رهبری به متن، گفت: این موضوع را از سه سال پیش آغاز کردیم و بیانات رهبری را در بخش کلمات و ادبیات و نیز صدا و آکوستیک مورد تحلیل و پردازش قرار دادیم که با حجم وسیعی از واژگان و غنای کلمات رهبر انقلاب مواجه شدیم.
وی در این باره توضیح داد: تحلیل انجام شده روی کلمات و متون سخنرانیهای مقام معظم رهبری حاکی از آن است که ایشان ۶۰ هزار کلمه و واژه اختصاصی طی این سالها به کار بردهاند و این در حالی است که یک فرد عادی در طول عمر خود با کمتر از ۱۰هزار کلمه اختصاصی سر و کار دارد.
ویسی تصریح کرد: در همین حال بررسیهای صورت گرفته از مجموعه متون شکسپیر نیز نشان میدهد که کل کلمات به کار رفته در این مجموعه حدود ۳۰ هزار کلمه بوده است و این امر نشان از حجم وسیع واژگان و غنای کلمات مقام رهبری دارد.
وی ادامه داد: پردازش و تحلیل محتوای کلمات پرکاربرد از فرمایشات رهبری نیز حاکی از آن است که کلماتی مانند اسلامی، ملت، کشور، کار، اسلام، ایران، وجود، انقلاب، دنیا، سال، نظام، انسان، امام، دشمن، حرکت، روز، خدا، جمهوری، الهی و بزرگ جزو ۲۰ کلمه پرکاربرد فرمایشات رهبر انقلاب طی ۲۳ سال اخیر بوده است.
ویسی با اشاره به اینکه در این سیستم بالغ بر ۱۵۰ هزار واژه تعریف شده است، گفت: با توجه به اینکه زبان یک پدیده زنده است و کلمات جدید در آن ایجاد میشود، این نرمافزار قابلیت به روز رسانی هر هفتماه یک بار را دارد.
به گفته وی، تبدیل گفتار به متن حداقل ۱۰ دقیقه و نهایتا یک ساعت بسته به مدت زمان متن ضبط شده، حجم سرور، سی پی یو و پردازنده زمان میبرد.