پرش به محتویات

mizan_reader

این ماژول شامل کلاس‌ها و توابعی برای خواندن پیکرهٔ میزان است.

پیکرهٔ میزان حاوی بیش از ۱ میلیون جمله از متون انگلیسی (اغلب در حوزهٔ ادبیات کلاسیک) و ترجمهٔ این جملات به فارسی که توسط دبیرخانهٔ شورای عالی اطلاع‌رسانی تهیه شده است..

MizanReader

این کلاس شامل توابعی برای خواندن پیکرهٔ میزان است.

پارامترها:

نام نوع توضیحات پیش‌فرض
corpus_folder str

مسیر فولدر حاوی فایل‌های پیکرهٔ میزان.

اجباری

english_sentences()

جملات انگلیسی را یک‌به‌یک برمی‌گرداند.

مثال‌ها:

>>> mizan = MizanReader("mizan")
>>> next(mizan.english_sentences())
The story which follows was first written out in Paris during the Peace Conference

خروجی تدریجی:

نوع توضیحات
str

جملهٔ انگلیسی بعدی.

persian_sentences()

جملات فارسی را یک‌به‌یک برمی‌گرداند.

مثال‌ها:

>>> mizan = MizanReader("mizan")
>>> next(mizan.persian_sentences())
داستانی که از نظر شما می‌گذرد، ابتدا ضمن کنفرانس صلح پاریس از روی یادداشت‌هائی که به طور روزانه در حال خدمت در صف برداشته شده بودند

خروجی تدریجی:

نوع توضیحات
str

جملهٔ فارسی بعدی.

english_persian_sentences()

جملات انگلیسی و فارسی را کنار هم در قالب یک زوج (جملهٔ انگلیسی، جملهٔ فارسی) یک‌به‌یک برمی‌گرداند.

مثال‌ها:

>>> mizan = MizanReader("mizan")
>>> next(mizan.english_persian_sentences())
("The story which follows was first written out in Paris during the Peace Conference", "داستانی که از نظر شما می‌گذرد، ابتدا ضمن کنفرانس صلح پاریس از روی یادداشت‌هائی که به طور روزانه در حال خدمت در صف برداشته شده بودند")

خروجی تدریجی:

نوع توضیحات
str

جملهٔ بعدی در قالب یک زوج (جملهٔ انگلیسی، جملهٔ فارسی).