الف‌با

نویسه‌خوان فارسی

ویژگی‌ها

خواندن نوشته‌های تصویر

قلم‌های گوناگون

خواندن متون نوشته‌شده با قلم‌های مختلف و در اندازه‌های متفاوت مثل عنوان، متن یا پاورقی‌ها

اصلاح تصویر

اصلاح نویز، چرخش و سایه تصویر برای دقیق‌تر خواندن متن

فارسی و انگلیسی

خواندن نویسه های فارسی، انگلیسی و البته زبان های مشابه مثل عربی و دری؛ همه در کنار هم و در یک تصویر

اطمینان از درستی

مشخص کردن بخش‌هایی از نوشته که با «تردید» خوانده شده‌اند؛ برای بازنگری توسط انسان

ساختار سند

چیدن عنوان، متن، تصویر و جدول در صفحه نتیجه برای حفظ ساختار سند مورد تحلیل

حرکت‌های حروف

خواندن نوشته‌ها و حذف حرکت‌ها از عباراتِ فارسی یا عربی مثل آیات قرآن کریم

در کتابخانه

صفحه‌های کاغذ لابه‌لای قفسه‌های کتابخانه منتظر ورود به دنیای نو هستند.

  • انبوه کتاب‌ها
  • پایان‌نامه‌ها
  • آرشیو مجلات

در سازمان

پرونده‌ها و نامه‌ها روی هم انباشته شده و در اتاق‌های بایگانی خاک می‌خورند. مسیر «دولت الکترونیک» از ورود این اسناد به دنیای دیجیتال می‌گذرد:

  • اسناد اداری مثل پرونده، نامه و فکس
  • اسناد مالی مثل فاکتور، صورت‌حساب و چک

در کسب و کارها

کاغذ و نوشته همه جا پیدا می‌شود

  • اتوماسیون اداری
  • آرشیو اسناد
  • مالی و حسابداری
  • موتور جستجو

نکات فنی

برای اهل فن

دقیق و سریع

الفبا با دقت ۹۷٪ نوشته‌های سند را می‌خواند و با سخت‌افزار مناسب می‌تواند ۲۰ صفحه A4 را در هر دقیقه تحلیل کند. البته دقت نویسه‌خوان به کیفیت اسناد ورودی هم ربط دارد.

یادگیری عمیق

الفبا با کمک فناوری روز دنیا یعنی یادگیری عمیق، خواندن نویسه‌ها را با قلم‌های مختلف یاد گرفته است. این فناوری علاوه بر دقت بالا، امکان خواندن قلم‌های تازه را هم برای نویسه‌خوان فراهم می‌کند.

پردازش موازی

الفبا می‌تواند با استفاده از پردازنده گرافیکی (کارت گرافیک)، اسناد را چند برابر سریع‌تر پردازش کند. همچنین قابلیت استفاده از چند ماشین برای پردازش توزیع‌شده اسناد را فراهم می‌کند.

پردازش زبان طبیعی

الفبا جمله‌های فارسی را می‌شناسد. یعنی گاهی وقت‌ها که میان دو شکل مختلف یک عبارت تردید دارد، هر دو را در میان دیگر کلمات خط نوشته قرار می‌دهد، تا ببیند کدام‌یک جمله را بهتر کامل می‌کند.

الفبا در عمل

خواندن قلم‌ها و اندازه‌های مختلف

در صفحات متن معمولا عبارات بر اساس اهمیت‌شان با قلم و اندازه متفاوت نوشته می‌شوند. الفبا صفحه را می‌خواند در حالی که چند قلم متفاوت با اندازه‌های گوناگون در آن استفاده شده باشد.

اصلاح چرخش و نویز تصویر سند

گاهی تصویر اسکن‌شده متن، با نویز همراه است یا ممکن است کاغذ آن کمی چرخیده باشد. این اشکالات پیش از تحلیل متن سند، برطرف می‌شوند.

تحلیل ساختار سند

الفبا فاصله میان اجزای صفحه را بررسی می‌کند و ساختار سند، از جمله خطوط و پاراگراف‌ها را پیدا می‌کند. همچنین محل عکس‌های سند در خروجی حاصل از تحلیل آن مشخص می‌شوند.

حفظ ساختار داده‌های درون جدول

سندهایی که شکلی از پژوهش یا تحلیل را ارائه می‌کنند، پر هستند از جدول. الفبا با تشخیص ساختار جدول و مشخص کردن خانه‌های آن، محتوی هر خانه را با همان ساختاری که در جدول قرار گرفته‌اند باز می‌گرداند.