پرش به محتویات

quran_reader

این ماژول شامل کلاس‌ها و توابعی برای خواندن پیکرهٔ Quranic Arabic است.

پیکرهٔ Quranic Arabic شامل قواعد نحوی و اطلاعات ریخت‌شناسی تک‌تک کلمات قرآن کریم است.

QuranReader

این کلاس شامل توابعی برای خواندن پیکرهٔ Quranic Arabic است.

پارامترها:

نام نوع توضیحات پیش‌فرض
quran_file str

مسیر فایلِ پیکره

اجباری

parts()

اجزای متن قرآن را به‌همراه اطلاعات نحوی‌شان برمی‌گرداند.

یک جزء لزوماً یک کلمه نیست؛ مثلاً واژهٔ «الرحمن» از دو جزء «ال» و «رحمن» تشکیل شده است.

مثال‌ها:

>>> parts=QuranReader(quran_file='quranic_corpus_morphology.txt').parts()
>>> print(next(parts))
{'loc': (1, 1, 1, 1), 'text': 'بِ', 'tag': 'P'}
>>> print(next(parts))
{'loc': (1, 1, 1, 2), 'text': 'سْمِ', 'tag': 'N', 'lem': 'ٱسْم', 'root': 'سمو'}
>>> print(next(parts))
{'loc': (1, 1, 2, 1), 'text': 'ٱللَّهِ', 'tag': 'PN', 'lem': 'ٱللَّه', 'root': 'اله'}

خروجی تدریجی:

نوع توضیحات
Dict[str, str]

جزء بعدی متن قرآن.

words()

اطلاعات صرفی کلمات قرآن را برمی‌گرداند.

مثال‌ها:

>>> words=QuranReader(quran_file='quranic_corpus_morphology.txt').words()
>>> print(next(words))
('1.1.1', 'بِسْمِ', 'ٱسْم', 'سمو', 'P-N', [{'text': 'بِ', 'tag': 'P'}, {'text': 'سْمِ', 'tag': 'N', 'lem': 'ٱسْم', 'root': 'سمو'}])

خروجی تدریجی:

نوع توضیحات
str

اطلاعات صرفی کلمهٔ بعدی قرآن.