mizan_reader
این ماژول شامل کلاسها و توابعی برای خواندن پیکرهٔ میزان است.
پیکرهٔ میزان حاوی بیش از ۱ میلیون جمله از متون انگلیسی (اغلب در حوزهٔ ادبیات کلاسیک) و ترجمهٔ این جملات به فارسی که توسط دبیرخانهٔ شورای عالی اطلاعرسانی تهیه شده است..
MizanReader
¶
این کلاس شامل توابعی برای خواندن پیکرهٔ میزان است.
پارامترها:
نام | نوع | توضیحات | پیشفرض |
---|---|---|---|
corpus_folder |
str
|
مسیر فولدر حاوی فایلهای پیکرهٔ میزان. |
اجباری |
english_sentences()
¶
جملات انگلیسی را یکبهیک برمیگرداند.
مثالها:
>>> mizan = MizanReader("mizan")
>>> next(mizan.english_sentences())
The story which follows was first written out in Paris during the Peace Conference
خروجی تدریجی:
نوع | توضیحات |
---|---|
str
|
جملهٔ انگلیسی بعدی. |
persian_sentences()
¶
جملات فارسی را یکبهیک برمیگرداند.
مثالها:
>>> mizan = MizanReader("mizan")
>>> next(mizan.persian_sentences())
داستانی که از نظر شما میگذرد، ابتدا ضمن کنفرانس صلح پاریس از روی یادداشتهائی که به طور روزانه در حال خدمت در صف برداشته شده بودند
خروجی تدریجی:
نوع | توضیحات |
---|---|
str
|
جملهٔ فارسی بعدی. |
english_persian_sentences()
¶
جملات انگلیسی و فارسی را کنار هم در قالب یک زوج
(جملهٔ انگلیسی، جملهٔ فارسی)
یکبهیک برمیگرداند.
مثالها:
>>> mizan = MizanReader("mizan")
>>> next(mizan.english_persian_sentences())
("The story which follows was first written out in Paris during the Peace Conference", "داستانی که از نظر شما میگذرد، ابتدا ضمن کنفرانس صلح پاریس از روی یادداشتهائی که به طور روزانه در حال خدمت در صف برداشته شده بودند")
خروجی تدریجی:
نوع | توضیحات |
---|---|
str
|
جملهٔ بعدی در قالب یک زوج
|