27 |
36 |
37 |
38 |
--------------------------------------------------------------------------------
/docs/AUTHORS.txt:
--------------------------------------------------------------------------------
1 | Taha Zerrouki
2 |
3 |
--------------------------------------------------------------------------------
/docs/HowTo.odt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/linuxscout/mishkal/d9529df26b27421738a0f429a655358853a10558/docs/HowTo.odt
--------------------------------------------------------------------------------
/docs/Ideas.odt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/linuxscout/mishkal/d9529df26b27421738a0f429a655358853a10558/docs/Ideas.odt
--------------------------------------------------------------------------------
/docs/README.txt:
--------------------------------------------------------------------------------
1 | Mishkal : Arabic text vocalization system
2 | مشكال لتشكيل النصوص العربية
3 | This program is licensed under the GPL License
4 | Developpers:
5 | Taha Zerrouki: http://tahadz.com
6 | taha dot zerrouki at gmail dot com
7 |
8 |
9 | Site:
10 | ==========
11 | http://tahadz.com
12 | Download
13 | ==========
14 | http://mishkal.sourceforge.net
15 | Source
16 | =============
17 | http://svn.arabeyes.org
18 | http://github.com/linuxscout/mishkal
19 |
20 |
21 | Usage
22 | =====
23 | * Windows :
24 | -----------
25 | Run MishkalGui
26 |
27 | * GUI: Linux
28 | ---------------
29 | - mishkal-gui
30 | *Web server (linux, windows)
31 | -----------
32 | mishkal-webserver
33 | serving on 0.0.0.0:8080 view at http://127.0.0.1:8080
34 | open in your browser the URL: http://127.0.0.1:8080
35 |
36 | * Console (linux/windows)
37 | -----------------
38 | Usage: mishkal-console -f filename [OPTIONS]
39 | mishkal-console 'السلام عليكم' [OPTIONS]
40 |
41 | [-f | --file= filename]input file to mishkal-console
42 | [-i | --ignore] ignore the last Mark on output words.
43 | [-r | --reduced] Reduced Tashkeel.
44 | [-s | --strip] Strip tashkeel (remove harakat).
45 | [-h | --help] outputs this usage message
46 | [-v | --version] program version
47 | [-l | --limit] vocalize only a limited number of line
48 | [-x | --syntax] disable syntaxic analysis
49 | [-m | --semantic] disable semantic analysis
50 | [-c | --compare] compare the vocalized text with the program output
51 | [-t | --stat] disable statistic tashkeel
52 |
53 | This program is licensed under the GPL License
54 |
55 |
56 | Files
57 | =====
58 | file/directory category description
59 | [program]
60 | mishkal-console.py program Mishkal script used on shell command
61 | mishkal-gui.py program launch mishkal GUI interface with QT
62 | mishkal-webserver.py web lauch mishkal web server
63 |
64 | [docs]
65 | docs/ docs documentation
66 | [setup]
67 | exe_setup.py setup prepare setup for windows using py2exe
68 | setup.py setup setup for library and linux package
69 | [mishkal]
70 | aranasyn/ src Arabic syntaxic analyzer
71 | asmai/ src Arabic syntaxic analyzer
72 | core/ src basic tools
73 | gui/ src GUI source
74 | tashkeel/ src Tashkeel module source
75 | [lib]
76 | lib/ lib Libraries
77 | [data]
78 | data/ data databases files
79 | [resouces]
80 | ar/ resources reources for gui arabic
81 | [log]
82 | tmp/ log tomporary fdirectory for web service
83 | [tools]
84 | cleanpyc setup a shell script to remove .pyc files
85 | [test]
86 | output/ test test output
87 | samples/ test sample files
88 | tools/ test script to use mishkal
89 | [web]
90 | files/ web files used for web service
91 | templates/ web Templates used for web service
92 | adawaty.py web a script for web service
93 | cgirunner.py web a script for web service using cgi
94 | crossdomain.xml web Configuration file to allow cross domain json API
95 | index.html web an index file to avoid directory access
96 | mishkal.cgi web A cgi Script used on web service
97 | mishkal-webserver.py web lauch mishkal web server
98 | [apps]
99 | mintiq TTS a shell script to join mishkla with espeak Text to speech
100 |
101 | JSON connection API:
102 | -----------------
103 | view docs/html/index.html (in arabic)
104 |
--------------------------------------------------------------------------------
/docs/THANKS.txt:
--------------------------------------------------------------------------------
1 | Credits
2 | Many thanks to the following individuals who have provided useful feedback and contibutions.
3 |
4 | Abdelwahab Djoudi
5 | Sohaib Afifi.
6 | Assem Chelli
7 | Bassem Jarkas
8 | Ibrahim Bounehasse
9 | Mohamed Attia
10 | Dr. Nada Ghoneim
11 | Waleed Alhassan
12 | Mohamed Chaaban (linuxac.org)
13 | Mos'ab alZu'bi (linuxac.org)
14 | Taha munzir
15 | Walid Ziouche
16 | Fahad Al-Saidi
17 |
18 |
--------------------------------------------------------------------------------
/docs/TODO.txt:
--------------------------------------------------------------------------------
1 | - إضافة قاعدة الافعال الناقصة مع التصريف
2 | - العفل المضارع المسبوق بحرف غير مؤثر يكون مرفوعا
3 | - الفعل المسبوق بضمير منصوب منفصل ، لايأتي بعده مفعول
4 | - حرف عطف واسم إشارة تعتبر استئنافا
5 | - إضافة علاقة التبعية
6 | - إضافة حقل محل الإعراب للكلمة * تم
7 | - إضافة البناء للكلمة *تم
8 | - إضافة الضمير والزمن إلى الفعل
9 | - الضمير نوعه ونوعه
10 | - الزمن نوعه بناؤه
11 | - تقليل الحقول: *تم
12 | استخدام ترميز ثنائي من أجل السماح بعدة خيارات
13 | not defined : 0 00000
14 | factor : 1 00001
15 | Rafe3 : 2 00010
16 | Naseb : 4 00100
17 | Jar : 8 01000
18 | Jazem : 16 10000
19 | active : 32 100000
20 | - حقل واحد للحالة الإعرابية
21 | - مبني مرفوع، منصوب، مجرور، مجزوم
22 | - حقل واحد للعدد
23 | - مفرد، مثنى، جمع (نوع الجمع: مؤنث سالم، مذكر سالم، تكسير
24 | - حقل واحد للجنس: مذكر مؤنث
25 | - حقل واحد للقسم: اسم، حرف، فعل
26 | - أقسام الاسم: علم، صفة،
27 | - حقل واحد للعامل: عامل/ عاطل، رافع، ناصب، جار، جازم،
28 | - عرض معلومات أكثر في الموقع، عرض إعراب الكلمة * تم
29 | - استبدال كل العبارات النصية في الكود بمجموعة من الوسوم المعرفة في ملف واحد
30 | - اختيار عينات نصية أفضل.
31 | - مشكلة في تنوين الأسماء المقصورة مثل راع، ووال، وقاض
32 | - قمنا باختصار عددة حالات التنوين، لكنها لم تفلح لأنّ للتنوين عدة أنواع.
33 | - فكرة تلوين الكلمات غير المؤكدة التشكيل بلون مميّز
34 | - إضافة خاصية التحليل الصرفي دون إعراب.
35 | - التشكيل الخفيف والمبسّط والواضح:
36 | - التشكيل الخفيف بإعراب ودون إعراب
37 | - التشكيل الواضح ما وضحت حروفه، وهو مثل تشكيل ما قبل الألف وما قبل التاء،
38 | - التشكيل المبسّط أن يتم توليد التشكيلات دون تحليل صرفي
39 | - نستعمل أنواع التشكيل المبسط والخفيف والواضح في تسهيل النطق
40 | - جرد الكلمات ذات التشكيل الوحيد دون إعراب أو مع الإعراب.
41 | - تشكيل الجملة في خطوتين، الأولى لاكتشاف التراكيب النحوية الواضحة، وفي الثانية لتحليل الأمور الملتبسة.
42 | - إعادة تصميم التحليل الصرفي مما يسمح بتجميع المعلومات حسب إطارها النحوي والدلالي، مثلا ضربَ، ضربُ، ضربِ، تكون مجتمعة في مجموعة واحدة وما يفرقها هو إعرابها. كما تجمع ضرْب وضرَب في إطار واحد باعتبارهما متشاكلتين.
43 | - تغيير حركة هاء الضمير المتصلة بعد مجرور مثل عبدِهِم * تم
44 | - تصحيح التنوين قبل اسم موصول مثل "تنظيم ما أريد"
45 | - تصريف الأسماء الحرفية مثل كلّ، بعض، وهي من كلّ ومن بعض.
46 | - تصحيح الأخطاء الشائعة، وتجاوز التشكل غير الصالح
47 | -
48 | - تحسين ملف السجل وضغطه
49 | - حالات الخطأ الشائع في كتابة الياء المصرية
50 | - معجم الأسماء
51 | - تغيير حركة هاء الضمير المتصلة بعد مجرور مثل عبدِهِ تم *
52 | - تحسين المحلل الصرفي مع الاسماء
53 | - معالجة العطف
54 | - الإضافة اللفظية مثل لاعبو الفريق تم *
55 | - إضافة كلمات شائعة منصوبات مثل جدَّا مؤخرا
56 | - استعمال بيانات خارجية على هيئة XML
57 | - تطوير آلية لتقييم أداء التشكيل
58 | * التشكيل المختزل. تم
59 | اختزال التشكيل مع توليد الاقتراحات
60 | - إضافة خيارات التشكيل
61 | التشكيل المختزل* تم
62 | قياس الأداء * تم
63 | تصحيح تلقائي *تم
64 | توليد الاقتراحات* تم
65 | إزالة التشكيل
66 | إزالة الحركات ما عدا الشّدّة
67 | - معالجة الكلمات المستبعدة وعرض اقتراحاتها
68 | - إعادة التشكيل بعد تعديلات المستخدم
69 | - معالجة التشكيل الجزئي للكلمات والشدة 80%
70 | - معالجة الشدّة 80%
71 | - إعادة ترتيب الأصناف
72 | - المحلل النحوي
73 | - البدل: هذا
74 | - معالجة إعراب الحروف
75 | - المتلازمات اللفظية
76 | - تشكيل المنلازمات
77 | - عرض نصوص عشوائية في الخانة
78 | * سجل المدخلات * تم
79 | - سجل التصحيح
80 | - تصميم جيد
81 | - التصحيح التلقائي.
82 | - واجهة سطح مكتب* تم
83 | - واجهة تطبيق للويب، يمكن استعمالها في مواقع أخرى.
84 | - وضع علامة للحروف الصامنة
85 | = استغلال المترادفات والأضداد في التشكيل من خلال التعويض.
86 | - بناء قاعدة بيانات الأسماء,
87 |
--------------------------------------------------------------------------------
/docs/VERSION.txt:
--------------------------------------------------------------------------------
1 | version 0.5
2 | date 2013-05-18
3 | version 0.4
4 | date 2013.02.19
5 | version 0.3
6 | date : 31-12-2012
7 |
--------------------------------------------------------------------------------
/docs/html/images/gotashkeel.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/linuxscout/mishkal/d9529df26b27421738a0f429a655358853a10558/docs/html/images/gotashkeel.png
--------------------------------------------------------------------------------
/docs/html/images/mishkal.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/linuxscout/mishkal/d9529df26b27421738a0f429a655358853a10558/docs/html/images/mishkal.png
--------------------------------------------------------------------------------
/docs/html/images/mishkal_alpha_smpl.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/linuxscout/mishkal/d9529df26b27421738a0f429a655358853a10558/docs/html/images/mishkal_alpha_smpl.png
--------------------------------------------------------------------------------
/docs/html/images/mixkal.jpg:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/linuxscout/mishkal/d9529df26b27421738a0f429a655358853a10558/docs/html/images/mixkal.jpg
--------------------------------------------------------------------------------
/docs/ideas.txt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/linuxscout/mishkal/d9529df26b27421738a0f429a655358853a10558/docs/ideas.txt
--------------------------------------------------------------------------------
/epydoc.conf:
--------------------------------------------------------------------------------
1 | [epydoc] # Epydoc section marker (required by ConfigParser)
2 |
3 | # Information about the project.
4 | name: Mishkal Arabic text vocalization software مشكال لتشكيل النصوص العربية
5 | url: https://github.com/linuxscout/mishkal/
6 |
7 | # The list of modules to document. Modules can be named using
8 | # dotted names, module filenames, or package directory names.
9 | # This option may be repeated.
10 | modules: sys, os.path, re
11 | modules: mishkal/tashkeel/tashkeel.py
12 |
13 | # Write html output to the directory "apidocs"
14 | output: html
15 | target: doc/html/
16 |
17 | # Include all automatically generated graphs. These graphs are
18 | # generated using Graphviz dot.
19 | graph: all
20 | dotpath: /usr/bin/dot
21 |
--------------------------------------------------------------------------------
/interfaces/gui/ar/about.html:
--------------------------------------------------------------------------------
1 |
2 |
3 |
4 | مشكال: تشكيل النصوص العربية
5 |
6 |
7 |
8 |
9 |
التشكيل
10 |
تشكيل النصوص العربية أهم مسائل معالجة اللغة العربية، بلوغه يقتضي تجاوز عقبات عديدة، وقد أهمّت هذه المسألة الكثير من الباحثين، وحتى الشركات، لتزاحمنا غوغل بتطبيق تشكيل.
11 |
12 |
تسمية المشروع:
13 |
نريد أن نسمي هذا المشروع “مشكال”، وهو أداة بصرية لصنع الأشكال الملونة المزخرفة، kaleidoscope.
11 | أكتب النص في الخانة، ثم اضغط على زر التشكيل.
12 |
13 |
14 | للحصول على اقتراحات التشكيل، عليك أولا ضغط زر التشكيل لتشكيل النص كاملا، ومن ثم يمكن الضغط بزر الفأرة الأيمن على الكلمة للحصول على مقترحات التشكيل.
15 |
16 |
17 | للحصول على تشكيل مختزل، يرجى اختيار "تشكيل مختزل".
18 |
تشكيل النصوص العربية أهم مسائل معالجة اللغة العربية، بلوغه يقتضي تجاوز عقبات عديدة، وقد أهمّت هذه المسألة الكثير من الباحثين، وحتى الشركات، لتزاحمنا غوغل بتطبيق تشكيل.
11 |
12 |
تسمية المشروع:
13 |
نريد أن نسمي هذا المشروع “مشكال”، وهو أداة بصرية لصنع الأشكال الملونة المزخرفة، kaleidoscope.
11 | أكتب النص في الخانة، ثم اضغط على زر التشكيل.
12 |
13 |
14 | للحصول على اقتراحات التشكيل، عليك أولا ضغط زر التشكيل لتشكيل النص كاملا، ومن ثم يمكن الضغط بزر الفأرة الأيمن على الكلمة للحصول على مقترحات التشكيل.
15 |
16 |
17 | للحصول على تشكيل مختزل، يرجى اختيار "تشكيل مختزل".
18 |
18 | قطرب
19 | هو أبو علي محمد بن المستنيربن أحمد البصري، أحد من اختلف إلى سيبويه وتعلم منه، وكان يدلج إليه، وإذا خرج رآه على
20 | بابه غدوة وعشية، فقال له: ماأنت إلا قطرب ليل! فلقب به. واشتهر بمثلثات قطرب. وأول من ألف رسالة في أبنية الأفعال.
21 |
32 | قطرب وقطروب ذكر الغيلان. قال: ولغة أزدية يسمون الكلاب الصغار
33 | القطارب. وقال ثعلب: القطرب دويبة كثيرة الحركة وهو الصرار. قال: يروى عن
34 | النبي صلى الله عليه وسلم: إن أحدكم جيفة ليل قطرب نهار! أي لايقوم بالليل
35 | لخير ولاصلاة ويتحرك بالنهار كهذه الدويبة.
36 |
37 |
38 |
39 | هذا وقد غلب هذا الاسم عليه واشتهر به، وكان من كبار أئمة اللغة في
40 | عصره.
41 |
42 |
43 |
مثلثات قطرب
44 |
45 | وهو أول من وضع المثلث في اللغة العربية، وتبعه غيره كالبطليوسي والخطيب والبلنسي. واشتغل معلمًا لأولاد الأمير أبي دلف العجلي وممن شرح مثلثات قطرب ضياء الدين أبو العز المغيث بن علوي البغدادي اللغوي الحنبلي المتوفى سنة 583 هـ.
46 |