quran_reader
این ماژول شامل کلاسها و توابعی برای خواندن پیکرهٔ Quranic Arabic است.
پیکرهٔ Quranic Arabic شامل قواعد نحوی و اطلاعات ریختشناسی تکتک کلمات قرآن کریم است.
QuranReader
¶
این کلاس شامل توابعی برای خواندن پیکرهٔ Quranic Arabic است.
پارامترها:
نام | نوع | توضیحات | پیشفرض |
---|---|---|---|
quran_file |
str
|
مسیر فایلِ پیکره |
اجباری |
parts()
¶
اجزای متن قرآن را بههمراه اطلاعات نحویشان برمیگرداند.
یک جزء لزوماً یک کلمه نیست؛ مثلاً واژهٔ «الرحمن» از دو جزء «ال» و «رحمن» تشکیل شده است.
مثالها:
>>> parts=QuranReader(quran_file='quranic_corpus_morphology.txt').parts()
>>> print(next(parts))
{'loc': (1, 1, 1, 1), 'text': 'بِ', 'tag': 'P'}
>>> print(next(parts))
{'loc': (1, 1, 1, 2), 'text': 'سْمِ', 'tag': 'N', 'lem': 'ٱسْم', 'root': 'سمو'}
>>> print(next(parts))
{'loc': (1, 1, 2, 1), 'text': 'ٱللَّهِ', 'tag': 'PN', 'lem': 'ٱللَّه', 'root': 'اله'}
خروجی تدریجی:
نوع | توضیحات |
---|---|
Dict[str, str]
|
جزء بعدی متن قرآن. |
words()
¶
اطلاعات صرفی کلمات قرآن را برمیگرداند.
مثالها:
>>> words=QuranReader(quran_file='quranic_corpus_morphology.txt').words()
>>> print(next(words))
('1.1.1', 'بِسْمِ', 'ٱسْم', 'سمو', 'P-N', [{'text': 'بِ', 'tag': 'P'}, {'text': 'سْمِ', 'tag': 'N', 'lem': 'ٱسْم', 'root': 'سمو'}])
خروجی تدریجی:
نوع | توضیحات |
---|---|
str
|
اطلاعات صرفی کلمهٔ بعدی قرآن. |