نوع مقاله : مقاله پژوهشی
نویسندگان
1 کارشناس ارشد، گروه پژوهشی زبان شناسی رایانه ای، مرکز منطقه ای اطلاع رسانی علوم و فن آوری، شیراز، ایران
2 استادیار، گروه زبان شناسی رایانه ای، مرکز منطقه ای اطلاع رسانی علوم و فن آوری، شیراز، ایران
3 استادیار، گروه پژوهشی طراحی و عملیات سیستم ها، مرکز منطقه ای اطلاع رسانی علوم و فن آوری، شیراز، ایران
چکیده
کلیدواژهها
موضوعات
عنوان مقاله [English]
نویسندگان [English]
Abstract:
One of the most important aspects of word-formation is considered as productivity which is a continuum concept in morphology (Bauer, 1996, and Baayen, 2009). Booij (2007) says that the frequent process in word formation is derivation. To the best of the researchers’ knowledge, only a partial number of Persian derivational affixes have been investigated in previous studies so far. In this regard, the following corpus-based study is done to discuss more affixes of Persian language and to reach more comprehensive results. The current study tries to answer the following two questions: 1. What are the most and the least frequent affixes in Persian language? 2. Is there any relation between productivity and word meaning prediction? To fulfill the aims of the research, 166 affixes, consisting of 28 prefixes, 72 postfixes and 66 affixoids were collected by a python code which searches through the Monitor corpus. In this study, Baayen measurement (P*) was used to measure the productivity. Results of the study showed that the theory of Bauer (2004) about productivity and predictability of words is true in most cases but with few exceptions.
Keywords: Productivity, Affixes, Derivational, Prefix, Postfix, Affixoids, Baayen measurement.
Introduction:
Productivity means the extent to which new words are produced using a particular affix with a considerable frequency (Aronoff, 1976; Lieber, 1981; Al and Booij, 1981; Bauer, 2004; Booij, 2007). Shaghaghi (2010) treats productivity as a process in which new words are produced using a frequent word-formation rule, and Bauer (2004) claims that the meaning of words created by productive affixes is more predictable. As a consequence, the potential words and actual words of a language can be distinguished by studying and measuring the productivity.
Studying the productivity can be done through morphology and syntax. Considering syntax, an unlimited number of sentences can be produced due to syntactic rules. Regarding morphology, it is impossible to produce unlimited words due to limitations imposed on word-formation rules which are syntactic, phonetic, morphological, and semantic. Therefore, in order to study the productivity, classification of affixes is needed. In general, affixes are considered as conditioned morphemes, creating new words or creating other forms of already existing words (Tabatabaei, 2016). According to Samie et al (2008) there are two types of affixes: Derivational affixes and Inflectional affixes. Besides, there are other kinds of affixes in Persian language:
Affixoids, which are morphemes that are no longer used as free morphemes and can be used as affixes such as /pæɹæst/ in /vætænpæɹæst/. Having said that, /pæɹæst/ is a free morpheme that is used to function as a stem. The difference between such affixes and other derivational ones is that they can take conditioned morphemes as an affix and create new words.
There are some words that take a secondary meaning besides their former ones, over time, and function as affixes in words to create a different meaning. For example: word /šâh/ functioning as an affix in /šâhɹâh/ (Kalbasi, 2008).
Complex afiixes, which are those that can be combined to create new affixes. For example: /ân+h= ânɛh/.
Affixes investigated in this study, to measure the productivity, consist of all the above-mentioned types.
Materials and Methods:
The population of the study consists of 166 Persian affixes, consisting of 28 prefixes and 72 postfixes, that were collected from different sources like Farshidvard (2013), Moein Dictionary and Kalbasi (2008). Moreover, a great portion of affixes was selected from Viravirast[1] which is a dataset of Persian affixes extracted from Persika[2] corpus and web using a crawler algorithm (viravirast.com). Furthermore, a section of a Monitor corpus[3] was selected Morgan rule. in order to find sample words for each affix.
Since there are four different affixes with one form and four different meanings in Persian language, having the context was necessary to differentiate the different types of that affix. Fir example: (ی/ i/ derivational, creating name), (ی/ i/ derivational, function like (-ness) in English), (ی/ i/ inflectional, for third singular), (ی/ i/ inflectional, functions like the determinator (a) in English). Therefore, Lancsbox[4] tool was also used to study this postfix through the context.
The research method consists of five stages. First, affixes were collected and divided into two groups of prefixes and postfixes. Second, the corpus was preprocessed. Third, affixes were searched through the corpus by a python code using NLTK and HAZM libraries. Fourth, the sample words for each affix were listed in an excel sheet. Fifth, nonwords were deleted and consequently, the related words were extracted.
To measure the productivity, Baayen general productivity measurement (P*) was used. P* = VN (1, c)/h. In this formula (VN) stands for hapax legomena for each affix and (h) stands for all hapax legomena for all affixes. Hapax legomena generally means words with one occurrence. Based on Baayen (2009) words with one frequency of occurrence are probably new words. Therefore, the higher the number of words with one frequency are, the more productive the process will be.
Discussion of Results and Conclusion:
The results of the current study, according to the Baayen's general productivity measurement, showed that among the Persian prefixes, "بی/ bi/" is considered as the most productive one and " پیـرا/ piɹâ/" and "ور/ væɹ/" are considered as the least productive ones. Also, among the Persian postfixes, "ی/ i/" is considered as the least productive one. Based on the study of Bauer (2004), the more frequent the affixes of words are, the more predictable their meaning will be. Results showed that the theory is accepted in most cases but some examples do not match. For example: (دار/ dâɹ/) is one of the productive affixes meaning (have), but the word /mæɹdomdâɹ/ does not mean to have people. It rather means humanitarianism, someone who behaves well to people.
[1] Viravirast is an automatic system for writing and editing Persian language.
[2] A Persian Corpus for Multipurpose Text Mining and Natural Language Processing.
[3] A Persian monitor corpus with different subject categories (2020-8-8).
[4] Lancsbox is one of corpus analysis tools.
کلیدواژهها [English]
زایایی[1] از مباحث مهم در فرایند واژهسازی است. صاحبنظران معمولاً، زایایی را یک پیوستار میدانند (Bauer, 2004; Baayen, 1992). به عقیدۀ بوی (2007) بهطور کلی فرایند اشتقاق، یک فرایند واژهسازی پرتکرار است. میزان قابلیت کاربرد یک وند در ساخت واژههای جدید را زایایی آن وند میگویند ( Aronoff, 1976 ; Lieber, 1981; Al, Booij, 1981; Bauer, 2004; Booij, 2007). همچنین، از منظر دیگری میتوان گفت که زایایی، به معنای تکرر استفاده از یک قاعده در ساخت واژههای جدید است (شقاقی، 1389). سنجش میزان زایایی، کمک میکند تا واژههای بالقوة زبان را از واژههای بالفعل تشخیص بدهیم (شقاقی، 1389). بائر (2004) معتقد است هرچه میزان زایایی بیشتر باشد، معنای واژه قابل پیشبینیتر است. در صورتهایی که زایایی بیشتری دارند، میتوان از معنای تکتک اجزای تشکیلدهندۀ واژه، به معنای کلی واژه پی برد. میتوان زایایی را از منظر ترکیب یک وند با پایههای مختلف نیز، بررسی کرد. آرونوف (1994) معتقد است که ترکیب وندها با پایه بهگونهای است که وندهای با زایایی کمتر، با پایههای پربسامدتر و وندهای زایا، با پایههای کمبسامدتر ترکیب میشوند. لادانا و بورانی[2] (1985) نیز معتقدند بنابر دلیلی نامشخص، کلمات مرکبی که با پایههای پربسامد ساخته شدهاند، در مقایسه با کلمات مرکبی که بهطور کلی همان میزان بسامد را دارند؛ اما پایههای کمبسامدتری دارند، زودتر تشخیص داده میشوند. سنجش میزان زایایی، به شناخت واژههای بالقوۀ زبان کمک میکند و شناخت واژههای پرتکرار و بالقوۀ زبان، در زبانآموزی، بسیار مؤثر است. همچنین، با بررسی تعداد زیادی از وندها میتوان به نتایج جامعی در خصوص زایایی وندها دست یافت. با توجه به پژوهشهای پیشین در حوزة سنجش میزان زایایی، میتوان گفت پژوهشهای کمی به بررسی این تعداد وند (نسبت به پژوهش حاضر)، پرداختهاند. در این پژوهش که پژوهشی پیکرهبنیاد است، هدف، بررسی میزان زایایی وندها از منظر میزان بسامد و محاسبة میزان زایایی با معیار باین است. در پژوهش حاضر به این پرسشها پاسخ خواهیم داد:
مفهوم زایایی، در صرف و نحو مطرح شده است؛ با این تفاوت که در حوزة نحو به دلیل استفاده از قواعد نحوی میتوان جملات نامحدودی تولید کرد؛ اما در حوزة صرف، قواعد صرفی و محدودیتهای ناظر بر آن، اجازة تولید بینهایت واژه را نمیدهند. شقاقی (1389) معتقد است زایایی به معنای استفادة مکرر از یک فرایند است. همچنین، وی معتقد است چنانچه یک فرایند ساختواژی بتواند با تمام پایهها از تمام مقولهها ترکیب شود، آن فرایند زایاست؛ اما چنین فرایندی بسیار نادر است. از دیگرسو، آرونوف (1976) معتقد است زایایی به معنای قابلیت استفاده از یک وند در ساخت واژههای جدید (نوواژه) است. براساس نظر شقاقی (1389)، میتوان گفت میزان زایایی را میتوان از بسامد واژههای موجود ساختهشده با یک وند در پیکره به دست آورد. برای بررسی میزان زایایی از منظر آرونوف (1976)، اطلاعات این پیکره به دلیل همزمانی بودن، کافی نیست. همچنین، بسامد واژههای موجود در پیکره، دربارۀ میزان ساخت نوواژهها اطلاعاتی نمیدهند.
اگر زایایی یک وند به معنای ترکیب یک وند با تمام مقولهها باشد، آیا میتوان چنین وندی را مشخص کرد؟ آیا میتوان گفت که بهطور کلی ترکیب یک وند با تمام مقولهها ممکن است؟ برای پاسخگویی به این پرسشها باید محدودیتهای ناظر بر فرایندهای واژهسازی را بررسی کرد. از محدودیتهای ناظر بر فرایندهای ساختواژی میتوان محدودیتهای نحوی، آوایی، صرفی و معنایی را نام برد.
درخصوص وندها باید گفت، وندها تکواژهایی وابسته هستند که به یک پایه افزوده میشوند و منجر به ساخت واژهای جدید یا صورت دیگری از واژة اصلی میشوند (طباطبایی، 1395).
بهطورکلی، وندها در ساخت واژههای مشتق و افعال پیشوندی کاربرد دارند. همچنین، وندها دو دستهبندی کلی دارند (سمیعی و همکاران، 1387): وندهای اشتقاقی و وندهای تصریفی.
در کنار این دو دسته، دستهبندیهای دیگری نیز برای وندها وجود دارد:
برخی وندها همآوا و همنویسه[5] هستند؛ مانند: «خر/صفت/پیشوند» در واژۀ «خرپول» و «خر/بن/پسوند» در واژۀ «شرخر».
در پژوهش حاضر تعدادی از پسوندوارههای زبان فارسی ارائه شدند. پژوهشگرانی همچون کشانی (1371) معتقدند وندوارهها نیز مانند وندها از ویژگی زایایی برخورداراند؛ اما در بررسی میزان زایایی تنها پیشوندها و پسوندها و برخی شبهوندها آورده شدهاند. بررسی میزان زایایی و محاسبات آماری بر پسوندوارهها انجام نشده است.
در پژوهش عباسی (1385)، محدودیتهای صرفی و نحوی در زایایی فرایند اشتقاق در زبان فارسی بررسی شده است. در این پژوهش با استفاده از معیار باین و بائر ( Baayen, 1994 ; Bauer, 2004) و با پیکرهای متشکل از متون ادبی ادبیات معاصر فارسی، تعدادی از محدودیتهای صرفی و نحوی بررسی شدهاند. در نتیجۀ این پژوهش، مشخص شد میان محدودیتهای صرفی و نحوی و میزان زایایی، رابطۀ معکوس وجود دارد. هرچه تعداد محدودیتها بیشتر باشد، میزان زایایی کمتر است. در پژوهش عابدینی و همکاران (1398) با استفاده از پیکرة همشهری و معیار باین، پیشوندهای اشتقاقی بررسی شدهاند. نتایج پژوهش نشان داد که پیشوند «غیر»، زایا و پیشوند «بل»، غیرزایاست. پژوهش فراگردی (1389) پیشوندهای کاربردی زبان فارسی، نقش پیشوندهای اشتقاقی در ساخت واژه، مقایسة پیشوندهای تصریفی و اشتقاقی از منظر نزدیکی با پایه بررسی کرده است. وی چنین نتیجهگیری کرده است که پیشوند «سر»، زایا و پیشوندهای «غیر» و «بر»، نیمهزایا هستند. شریفی و عرفانیان قونسولی (1390) با استفاده از چهار متن با موضوع سفرنامه (پرستو در قاف، سفرنامۀ شمس آلاحمد در آلمان و اسپانیا، سفرنامۀ فرنگ، اقلیمهای دیگر) و استخراج 700 واژه، میزان زایایی وندهای اشتقاقی را با استفاده از معیار باین محاسبه کردهاند. نتیجه چنین حاصل شد که وندهای «ی/ نسبت»، «ی، مصدری» و «ه»، بیشترین زایایی و وندهای «مان»، «در»، «سان»، «با»، «واده»، «فرا»، «وا»، «ال» و «وند»، کمترین زایایی را داشتهاند. در پژوهش محمدی (1390)، تعداد محدودی از پیشوندها و پسوندهای اشتقاقی بررسی شده است. وی پیشوند «هم» و پسوندهای «ش»، «ی/ نسبت» و «گاه» را زایاترین دانسته است. ذهاب ناظوری و همکاران (1398) در پژوهشی، «پیشوندوارههای زبان فارسی: تحلیلی شناختی»، با بهرهبری از پیکرۀ انوری (1381) پیشوندوارههای «خوش- و بد-» را با در نظر گرفتن سه عملیات شناختی «مقولهسازی»، «پیکربندی» و «مفهومسازی» بررسی کردهاند. نتیجۀ پژوهش چنین است که پیشوندها و پیشوندوارهها نیز مانند تمام عناصر زبانی دارای مفاهیمی هستند که نشاندهندۀ تجارب ذهنی متفاوت سخنوران زبان هستند. در پژوهش افراشی و کوشکی (1397) با استفاده از معیار تایلر و ایوانز[6] (2003) با تحلیل معناشناختی پیشوند (پیش-)، دو خوشۀ معنایی مرکزی ترتیب زمانی و ترتیب مکانی برای این وند مشخص شده است.
پژوهش باین و رنوف[7] (1996) با استفاده از پیکرة کوبیلد[8] و معیار باین انجام شد و نتیجه چنین شد که پیشوند «Un» و پسوندهای «ly» و «ness» در زبان انگلیسی، وندهایی زایا هستند. پژوهش کانن[9] (1988) با استفاده از پیکرة مریم وبستر[10] نیز نشان داد که پسوند «ly»، پسوندی غیرزایاست. پژوهش پوستیلنیکاو و اِشنایدر-ویووسکی[11] ( 2009) به بررسی وندهای اسمساز در زبان آلمانی با استفاده از دو پیکرة نوشتاری از متون روزنامهای و یک پیکرة گفتاری پرداخت. این پژوهش به مقایسة دو معیار زایایی از باین ( 1991 , 1992) و یک معیار زایایی از کریر[12] ( 2008) پرداخت و در نتیجة بررسی سه معیار، آنان نتایج مشابهی در تفکیک وندهای زایا از غیرزایا به دست آوردند. لیو و شن[13] (2012) به بررسی پسوند (–esque) بهصورت پژوهشی پیکرهبنیاد پرداختند. آنان با استفاده از پیکرة کوکا (COCA[14]) به این نتیجه رسیدند که وند مذکور از جمله وندهای زایایی است که در متون رسمی کاربرد دارد و کاربرد آن در ترکیب با اسم برای ساخت صفت، دیده شده است. گات و فابری[15] (2018) با بررسی وندهای «-vr» و «-z» که دو وند وامگرفته در زبان مالتسی[16] هستند، با استفاده از معیار باین به این نتیجه رسیدند که اگرچه هر دو وند زایا هستند؛ اما وند «-vr» در ساخت واژههای جدید پرکاربردتر است و منجر به ساخت صورتهای اسمی سادهتری میشود و صورتهای اسمی سادهتر معمولاً زایاترند. در پژوهش دنسیتا و باین[17] ( 2019)، با استفاده از بخشی از پیکرة نوشتاری لیپزیگ[18] و با استفاده از معیار باین، وندهای «pe-» و «pen-» که وندهای اسمساز هستند، بررسی شدند. در ابتدای پژوهش بهنظر میرسیده که این دو وند تکواژگونههای یکدیگرند؛ اما نتیجه چنین حاصل شد که این دو، وندهای جداگانهای هستند و پیشوند «pen»، پرکاربردتر است.
جامعة آماری این پژوهش، کلیهی وندهای اشتقاقی زبان فارسی است. پیشوندها و پسوندهای اشتقاقی از منابع مختلفی همچون فرشیدورد (1392)، فرهنگ معین (معین، 1386) و کلباسی (1387) گردآوری شدند. همچنین، بخش درخور توجهی از وندها برگرفته از مجموعه دادههای گروه ویراویراست[19] است (رحمانی و همکاران، 1399). وندهای ویراویراست از منابعی همچون پیکرة پرسیکا و سراسر وب به روش خزش[20] استخراج شدهاند. نمونههای این پژوهش نیز کلیة وندهای زایا و غیرزایای زبان فارسی است که از منابع مذکور جمعآوری شده است. شایان ذکر است تمام وندهای موجود در منابع نامبرده، مورد استفاده قرار نگرفتهاند و سعی شده است تا وندهای مرده و عقیم (سترون) حذف شوند. با استناد به فرشیدورد (1392: 269- 527)، برخی از وندها که پیشتر در متون قدیمی یا شاهنامه کاربرد داشتهاند و اکنون دیگر کاربردی ندارند، مرده محسوب میشوند (مانند: وند «یش» در خریش به معنای خلیده). همچنین، وندهایی هستند که در ساخت کلمات جدید بهکار نمیروند؛ اما کلماتی که پیشتر از ترکیب با این وندها ساخته شده است، مورد استفاده قرار میگیرند و آنها را وندهای سترون مینامیم (مانند وند «یک» در نزدیک).
برای جستوجوی واژههای نمونه برای هر وند، از پیکرة بهروزشونده (مولودی و رضایی شریفآبادی، 1399) بهعنوان منبع استفاده شده است (دسترسی از www.peikare.ir, 7/9/2021). پیکرۀ بهروزشوندۀ پارسی پیکرهای است برخط که با جستوجوی واژه یا عبارت مورد نظر، میتوان نمونههای فراوانی از کاربرد آن را در متون فارسی مشاهده کرد. هر روز متون جدید از خبرگزاریهای معتبر به پیکره اضافه میشوند. بنابراین، میتوان واژههای جدید مثل «برجام»، «برگزیت»، «اسپینر» و ... را هم در آن دید. نکتۀ دیگر آنکه، هر روز از شش دستۀ موضوعی «سیاسی»، «اقتصادی»، «اجتماعی»، «فرهنگی»، «علمی» و «ورزشی» به مقدار مساوی متن به پیکره اضافه میشود. این به آن معناست که پیکره از نظر موضوعی همواره متوازن است و میتوان نوع و میزان کاربرد واژه یا عبارت مورد نظر را در دستههای موضوعی مختلف نیز بررسی کرد.
در این پژوهش با در دست داشتن نسخۀ غیربرخط و تمام دستهبندیهای موضوعی پیکره، از میان 4538 پوشه، معادل 13/1 گیگابایت از تاریخ 29/12/1396 تا تاریخ 18/05/ 1399، با فرمول مورگان و با احتساب 10 درصد خطای فرمول، تعداد 354 پوشه برای بررسی و استخراج واژهها، انتخاب شد. در هر پوشه 5685 واژه وجود دارد. پس از جستوجوی وندها در پیکره، برای پیشوندها 14503 واژه جستوجو شد که پس از حذف واژههای نامرتبط، 4311 واژه باقی ماند. همچنین، برای پسوندها نیز در ابتدا، 37836 واژه جستوجو شد که پس از بررسی و حذف واژههای نامرتبط، 18062 واژه باقی ماند.
وندهایی که در پژوهش حاضر مورد بررسی قرار گرفتهاند، در دو دستۀ پیشوند و پسوند در جدولهای ذیل نمایش داده شدهاند:
Table 1- Prefixes
ابر |
بلا |
بی |
پر |
پیرا |
تک |
دژ |
فر |
نا |
هم |
با |
بر |
پاد |
پس |
پیش |
خر |
سر |
فرا |
وا |
|
باز |
بُل |
پارا |
پسا |
ترا |
در |
غیر |
فرو |
ور |
|
Table 2- Suffixes
اً (تنوین به روی الف) |
انه |
تا |
سَرا |
فرسا |
گرا |
نده |
ینه |
ا |
آسا |
چه |
سا |
فروز |
گسار |
وا |
یه |
اُم |
آگین |
چی |
سار |
فشان |
گون |
وار |
|
اُمین |
باره |
خانه |
سان |
ک |
گونه |
واره |
|
ا (افسوس) |
باز (اسمساز) |
خوار |
ستان (مکان) |
کار |
لا |
ور |
|
ا (ندا) |
بان |
دان |
سر |
کده |
لاخ |
وش |
|
اد |
بخت |
دیس |
سیر |
گار |
مند |
ه |
|
ار |
بد |
زاد |
ش (مصدرساز) |
گاه |
ن |
ی (مصدرساز) |
|
اک |
بس |
زار |
شاه |
گداز |
نا |
ی (نسبت) |
|
اکی |
بند |
زده |
فام |
گر |
ناک |
یار |
|
همچنین، تعدادی از وندوارههای زبان فارسی در جدول زیر ارائه شدند:
جدول 3- وندوارهها
Table 3- Affixoids
افراز |
باش |
پرور |
خوان |
زدا |
گذار |
نشین |
افروز |
باف |
پز |
خواه |
ساز |
گرد |
نگار |
افزا |
بخش |
پژوه |
خور |
سپار |
گزار |
نما |
افشان |
بر |
پوش |
خیز |
سنج |
گزین |
نواز |
انداز |
برانگیز |
پیما |
دار |
|
گستر |
نورد |
اندوز |
بین |
تراش |
دان (دانستن) |
شمار |
گشا |
نویس |
انگیز |
پذیر |
جو |
رس |
شناس |
گو |
یاب |
آموز |
پر |
چران |
ریز |
کُش |
گیر |
|
آمیز |
پرداز |
چین |
زا |
کِش |
نشان |
|
آور |
پرست |
خر |
زد |
کار (کاشتن) |
نشناس |
عمل جستوجو با استفاده از یک دستور برنامهنویسی به زبان پایتون، نسخة 3 و همچنین، فراخوانی کتابخانههای NLTK[21] و HAZM[22] انجام شد. در دستور برنامهنویسی، نخست، پیکرة دریافتشده پیشپردازش شد، سپس پیشوندها و پسوندها در پوشههای جداگانه توسط برنامه، دریافت شدند و سپس واژههای مرتبط با پیشوندها و پسوندها نیز همراه با بسامدشان در دو پوشۀ جداگانه، در قالب فایل excel فهرست شدند. نرمافزارهای واژهنمایی همچون انتکانک[23] و لنکسباکس[24] نیز میتوانند با دریافت پیکره و فهرست وندها، عمل جستوجو را انجام دهند؛ اما به دلیل زیاد بودن تعداد وندها، عدم امکان پردازش با سیستمهای خانگی و زمانبر بودن، یک دستور برنامهنویسی جایگزین شد (برای مدیریت زمان).
در بخشی از پژوهش برای بررسی و تفکیک پسوند «ی» به چهار نوع مصدرساز، نسبت، نکره، شناسه و کاربرد «ی» بهجای همزه، به متن پیکره نیاز بود. بدین منظور از نرمافزار لنکسباکس کمک گرفته شد. وند مربوطه در قسمتی که برای جستوجو تعبیهشده جستوجو میشود سپس، واژههایی که در آنها وند مدنظر بهکار رفتهاند بههمراه متنشان نمایان میشوند. با دسترسی به متن میتوان بهراحتی نمونههای مورد نیاز را بررسی کرد. برای مثال، پس از جستوجوی وند «ی» واژۀ «حسابرسی» برگردانده شد. با بررسی جملات مربوطه نکره یا مصدرساز بودن وند «ی» مشخص شد: «معاون امور شرکتهای مؤسسه در پاسخ به سؤال نحوۀ ادارۀ شرکتها و حسابرسی /(مصدرساز)/ آنها گفت: شرکتهای زیرمجموعه صندوق ذخیره همگی دارای سال مالی هستند.» به علت بسامد بالای وند «ی» از واژههای نمونة این وند، با استفاده از فرمول مورگان نمونهگیری شد و نمونهها بررسی شدند. «ی» شناسة دوم شخص، «ی» نکره و «ی» در کاربرد همزه به دلیل نامرتبط بودن، حذف شدند. بهطور کلی، پس از جستوجوی واژههای نمونه برای هر وند، در میان واژههای جستوجوشده، واژههای نامرتبطی وجود داشت که به روش دستی، بررسی و حذف شدند. منظور از واژههای نامرتبط واژههایی است که به علت غلط املایی از نوع جابهجایی، بیمعنا شدهاند (مانند: قدرتمند/ *قدرمتند) یا در آنها وند مدنظر در واقع به عنوان وند به کار نرفته است (مانند: سمپاد/ واژة سمپاد یک سرواژه است و وند «پاد» در آن به کار نرفته است). همچنین، از آنجا که پژوهش حاضر پژوهشی همزمانی است، واژههایی که بررسی آنها به بررسی تاریخی نیاز داشت، حذف شدند. بسامد واژههای جستوجوشده پس از بررسی و تفکیک، همراه با هر وند آورده شده است. همچنین، نکتة دیگری که در برچسبزنی وندها به آن توجه شد این بود که هر واژه ممکن است با بیش از یکوند، ترکیب شده باشد. در برچسبزنی تنها به پایه و وند مد نظر توجه شده است. همچنین، بروندادهای ترکیب هر وند با پایههای مختلف، ممکن است به چند مقولة دستوری تعلق داشته باشد؛ بنابراین، با توجه به متن و واژههای نمونه، ممکن است هر وند بیش از یک برچسب داشته باشد. برای مثال، برونداد ترکیب وند «باز» با پایة «گشت» میتواند اسم یا فعل یا هر دو باشد.
در فرمول زیر «I» همان شاخص زایایی و «v» تعداد واژههای موجود و «s» تعداد واژههای ممکن است.
I=v/s
در فرمول زیر، (P)، همان شاخص زایایی، (V)، تعداد واژههای تکبسامدی ساختهشده با یک وند و (N) تعداد کل واژههای مرتبط با آن وند در پیکره است.
P= VN (1)/N
در فرمول زیر، (P*) نشانة زایایی کلی،[28] (v) واژههای تکبسامدی با یک فرایند خاص و (h) تعداد کل نمونههای تکبسامدی است.
P* = VN (1,c)/h
محاسبات در برنامه excel انجام شد.
در محاسبة میزان زایایی وندها، با استفاده از معیار باین، به نمونههای تکبسامدی ساختهشده با هر وند و مجموع نمونههای تکبسامدی تمام وندها، نیاز داریم. منظور از نمونههای تکبسامدی، نمونههایی است که بسامدشان برابر با عدد 1 است؛ برای مثال، در بررسی پیشوند «باز» بسامد واژۀ «بازخور» برابر با 1 است. این بدین معناست که این واژه در جستوجو، تنها یکبار یافته شده است. برای بررسی میزان زایایی، پیشوندها و پسوندها را جداگانه محاسبه میکنیم. ابتدا به بررسی محاسبات انجامشده بر روی پیشوندها میپردازیم:
نمونههای تکبسامدی مربوط به هر پیشوند در جدول (4) نشان داده شده است. مجموع نمونههای تکبسامدی کل پیشوندها، برابر با 1458 عدد است.
با تقسیم نمونههای تکبسامدی هر وند بر تعداد نمونههای تکبسامدی کل وندها، اعداد ستون پنجم بهدست آمده است. در ستون ششم اعداد حاصل از تقسیم نمونههای تکبسامدی هر وند بر نمونههای تکبسامدی کل وندها P*(v/h)، برحسب درصد محاسبه شدهاند. وندها براساس میزان زایایی مرتب شدهاند.
Table 4- Productivity of prefixes
وند |
بسامد |
کارکرد |
(v)نمونههای تکبسامدی |
P*(v/h) |
بر حسب درصد |
بی |
6005 |
منفیساز/ صفتساز |
226 |
0/155 |
15/5 |
نا |
10577 |
منفیساز/ اسمساز/ صفتساز |
173 |
0/1186 |
11/86 |
پُر |
3519 |
صفتساز |
138 |
0/0946 |
9/46 |
هم |
50481 |
اسمساز/ صفتساز/ قیدساز |
132 |
0/0905 |
9/05 |
بر |
33262 |
فعلساز/ اسمساز |
129 |
0/0884 |
8/84 |
غیر |
4790 |
منفیساز/ صفتساز |
116 |
0/0795 |
7/95 |
سر |
17895 |
اسمساز |
104 |
0/0713 |
7/133 |
باز |
16722 |
فعلساز/ اسمساز |
97 |
0/0665 |
6/65 |
پیش |
11244 |
اسمساز/ صفتساز |
79 |
0/0541 |
5/41 |
فرا |
3978 |
اسمساز/ صفتساز/ فعلساز |
47 |
0/0322 |
3/22 |
در |
23233 |
فعلساز/ اسمساز |
42 |
0/0288 |
2/88 |
تک |
199 |
اسمساز/صفتساز |
33 |
0/0226 |
2/26 |
با |
741 |
صفتساز |
33 |
0/0226 |
2/26 |
وا |
8388 |
فعلساز/ اسمساز |
27 |
0/0185 |
1/85 |
فرو |
617 |
اسمساز/ صفتساز/ فعلساز |
23 |
0/0157 |
1/577 |
پس |
837 |
اسمساز |
11 |
0/0075 |
0/7544 |
فر |
2350 |
اسمساز |
11 |
0/0075 |
0/7544 |
ابر |
89 |
صفتساز |
8 |
0/0054 |
0/5486 |
پارا |
1557 |
اسمساز |
8 |
0/0054 |
0/54 |
بلا |
1142 |
صفتساز |
7 |
0/0048 |
0/48 |
پسا |
719 |
اسمساز |
6 |
0/0041 |
0/41 |
پاد |
176 |
اسمساز |
3 |
0/002 |
0/2 |
ترا |
312 |
صفتساز |
3 |
0/002 |
0/2 |
خر |
35 |
اسمساز |
1 |
0/0006 |
0/06 |
دژ |
194 |
صفتساز |
1 |
0/0006 |
0/06 |
پیرا |
75 |
اسمساز |
0 |
0 |
0 |
ور |
61 |
اسمساز/ صفت ساز/ فعلساز |
0 |
0 |
0 |
بل |
0 |
صفتساز |
0 |
0 |
0 |
جدول (4) نشان میدهد که زایاترین پیشوند «بی» و غیرزایاترین پیشوندها آنهایی هستند که محاسبه زایایی آنها برابر با صفر است؛ مانند «بل»، «پیرا» و «ور». عدد صفر بدین معناست که این وندها نمونههای تکبسامدی ندارند. همانطور که پیشتر اشاره شد، نمونههای تکبسامدی نشاندهندۀ واژههای جدید هستند. بنابراین، میتوان گفت از وندهایی که نمونههای تکبسامدیشان برابر با صفر است، در ساخت واژههای جدید استفاده نمیشود. درخصوص وندهایی که بسامد کلی واژههای نمونه با این وندها، صفر نیست، میتوان گفت کلماتی که از پیش با این وندها ساخته شدهاند، هنوز کاربرد دارند؛ بنابراین، وند غیرزایا محسوب میشوند و نه وند مرده یا عقیم. در جدول (5) محاسبة زایایی پسوندها آورده شده است.
نمونههای تکبسامدی کل پسوندها، برابر با 2319 عدد است.
Table 5- Productivity of suffixes
وند |
بسامد |
کارکرد |
(v) نمونههای تکبسامدی |
P*(v/h) |
بر حسب درصد |
ی (مصدرساز) |
40932 |
اسمساز |
603 |
0/26002587 |
26/0025873 |
ه |
60289 |
اسمساز/ صفتساز/ قیدساز |
348 |
0/15006468 |
15/0064683 |
انه |
20513 |
قیدساز |
285 |
0/1228978 |
12/2897801 |
ن |
43539 |
اسمساز |
225 |
0/09702458 |
9/70245796 |
نده |
12511 |
صفتساز |
126 |
0/05433376 |
5/43337646 |
گر |
16471 |
صفتساز |
111 |
0/04786546 |
4/78654592 |
زاد |
2521 |
صفتساز |
98 |
0/04225959 |
4/22595947 |
ی (نسبت) |
10705 |
اسمساز |
90 |
0/03880983 |
3/88098318 |
گرا |
805 |
صفتساز |
83 |
0/03579129 |
3/57912893 |
مند |
15032 |
اسمساز |
39 |
0/01681759 |
1/68175938 |
باز |
707 |
صفتساز |
25 |
0/01078051 |
1/07805088 |
زده |
432 |
صفتساز |
23 |
0/00991807 |
0/99180681 |
خانه |
3605 |
اسمساز |
22 |
0/00948685 |
0/94868478 |
وار |
2641 |
صفتساز |
21 |
0/00905563 |
0/90556274 |
خوار |
118 |
صفتساز |
19 |
0/00819319 |
0/81931867 |
گاه |
33119 |
اسمساز |
17 |
0/00733075 |
0/7330746 |
یه |
16983 |
اسمساز |
17 |
0/00733075 |
0/7330746 |
گونه |
1227 |
قیدساز |
12 |
0/00517464 |
0/51746442 |
ستان (مکان) |
14932 |
اسمساز |
12 |
0/00517464 |
0/51746442 |
بند |
612 |
صفتساز |
10 |
0/0043122 |
0/43122035 |
چی |
224 |
اسمساز |
10 |
0/0043122 |
0/43122035 |
سَرا |
1174 |
صفتساز |
10 |
0/0043122 |
0/43122035 |
اد |
2238 |
صفتساز |
9 |
0/00388098 |
0/38809832 |
شاه |
71 |
اسمساز |
9 |
0/00388098 |
0/38809832 |
اً (تنوین به روی الف) |
2590 |
قیدساز |
8 |
0/00344976 |
0/34497628 |
بان |
2156 |
صفتساز |
7 |
0/00301854 |
0/30185425 |
ور |
500 |
صفتساز |
6 |
0/00258732 |
0/25873221 |
ار |
5442 |
صفتساز |
5 |
0/0021561 |
0/21561018 |
ک |
679 |
اسمساز |
5 |
0/0021561 |
0/21561018 |
گون |
67 |
صفتساز |
5 |
0/0021561 |
0/21561018 |
ینه |
657 |
اسمساز |
5 |
0/0021561 |
0/21561018 |
زار |
194 |
صفتساز |
4 |
0/00172488 |
0/17248814 |
کده |
1136 |
صفتساز |
4 |
0/00172488 |
0/17248814 |
ناک |
1491 |
صفتساز |
4 |
0/00172488 |
0/17248814 |
آگین |
158 |
صفتساز |
3 |
0/00129366 |
0/12936611 |
بخت |
1900 |
صفتساز |
3 |
0/00129366 |
0/12936611 |
پناه |
134 |
صفتساز |
3 |
0/00129366 |
0/12936611 |
چه |
941 |
اسمساز |
3 |
0/00129366 |
0/12936611 |
یار |
620 |
اسمساز |
3 |
0/00129366 |
0/12936611 |
ا (ندا) |
53 |
صفتساز |
2 |
0/00086244 |
0/08624407 |
آسا |
28 |
صفتساز |
2 |
0/00086244 |
0/08624407 |
باره |
2417 |
قیدساز |
2 |
0/00086244 |
0/08624407 |
پیشه |
30 |
صفتساز |
2 |
0/00086244 |
0/08624407 |
تا |
28 |
اسمساز |
2 |
0/00086244 |
0/08624407 |
دان |
16 |
صفتساز |
2 |
0/00086244 |
0/08624407 |
دیس |
174 |
اسمساز |
2 |
0/00086244 |
0/08624407 |
سان |
326 |
اسمساز |
2 |
0/00086244 |
0/08624407 |
فشان |
208 |
صفتساز |
2 |
0/00086244 |
0/08624407 |
اکی |
29 |
صفتساز |
1 |
0/00043122 |
0/04312204 |
بد |
167 |
اسمساز |
1 |
0/00043122 |
0/04312204 |
سار |
34 |
صفتساز |
1 |
0/00043122 |
0/04312204 |
سیر |
135 |
اسمساز |
1 |
0/00043122 |
0/04312204 |
فام |
22 |
اسمساز |
1 |
0/00043122 |
0/04312204 |
فروز |
1 |
صفتساز |
1 |
0/00043122 |
0/04312204 |
گار |
1153 |
اسمساز |
1 |
0/00043122 |
0/04312204 |
گسار |
1 |
اسمساز |
1 |
0/00043122 |
0/04312204 |
لاخ |
1 |
اسمساز |
1 |
0/00043122 |
0/04312204 |
ا |
519 |
قیدساز |
0 |
0 |
0 |
اُم |
54 |
اسمساز |
0 |
0 |
0 |
اُمین |
3894 |
اسمساز |
0 |
0 |
0 |
ا (افسوس) |
10 |
اسمساز / صفتساز |
0 |
0 |
0 |
اک |
329 |
اسمساز |
0 |
0 |
0 |
بس |
586 |
اسمساز |
0 |
0 |
0 |
سا |
46 |
صفتساز |
0 |
0 |
0 |
سر |
4180 |
صفتساز |
0 |
0 |
0 |
ش (مصدرساز) |
1017 |
اسمساز |
0 |
0 |
0 |
لا |
2 |
صفتساز |
0 |
0 |
0 |
نا |
43 |
صفتساز |
0 |
0 |
0 |
واره |
2295 |
اسمساز |
0 |
0 |
0 |
وش |
21 |
اسمساز |
0 |
0 |
0 |
وا |
36 |
اسمساز |
0 |
0 |
0 |
واره |
2295 |
اسمساز |
0 |
0 |
0 |
همانطور که روشن است از میان پسوندها، پسوند «ی (مصدرساز)» زایاترین و پسوندهایی که تعداد نمونههایی تکبسامدی آنها برابر با صفر است، غیرزایاترینها هستند؛ مانند وندهای: «سر»، «ش (مصدرساز)»، «لا»، «نا»، «نشان»، «وا»، «واره» و «وش». همانگونه که دربارۀ پیشوندها توضیح داده شد؛ دربارۀ پسوندها نیز میتوان گفت از پسوندهایی که نمونههای تکبسامدی آنها برابر با صفر است، در ساخت واژههای جدید استفاده نمیشوند. همچنین، بسامد کلی واژههای نمونه ساختهشده با این پسوندها نشان میدهد واژههایی که پیشتر از ترکیب با این وندها ساخته شدهاند، هنوز کاربرد دارند. مقایسه نتیجه پژوهش حاضر با دیگر پژوهشها چنین است:
در پژوهش محمدی (1390)، پیشوند «هم» و از میان پسوندها، وندهای «ش»، «ی/ نسبت» و «گاه» را زایاترین دانستهاند. در پژوهش حاضر، در پیوستار زایایی، پیشوند «هم» در مرتبة زایاترین قرار ندارد. همچنین، از میان پسوندها نیز وندهای «ش»، «ی/ نسبت» و «گاه» در پیوستار زایایی جایگاه درخور توجهی ندارند. بنابراین، نتایج پژوهش حاضر با پژوهش مذکور همسو نیست. در پژوهش شریفی و عرفانیان قونسولی (1390)، وندهای «ی/ نسبت»، «ی، مصدری» و «ه» بیشترین زایایی و وندهای «مان»، «در»، «سان»، «با»، «واده»، «فرا»، «وا»، «ال» و «وند» کمترین زایایی را داشتهاند. در پژوهش حاضر نیز پسوندهای «ی (مصدرساز)»، «ه» و «ی (نسبت)» در مرتبة زایاترین پسوندها قرار دارند و نتایج پژوهش حاضر از این نظر با پژوهش مذکور همسو است. دربارۀ پسوندهای «مان»، «در»، «سان»، «با»، «واده»، «فرا»، «وا»، «ال» و «وند» باید گفت که این پسوندها در پیوستار زایایی این پژوهش، در جایگاه غیرزایاترینها قرار ندارند. بنابراین، نتایج پژوهش حاضر از این نظر با پژوهش مذکور همسو نیست. در پژوهش عابدینی و همکاران (1398)، پیشوند «غیر» با بیشترین زایایی مشخص شده است. در پژوهش حاضر پیشوند «غیر» در مرتبة زایاترین قرار ندارد. بنابراین، پژوهش حاضر در نتیجهگیری از زایایی پیشوند «غیر»، با پژوهش مذکور همسو نیست. در پژوهش فراگردی (1389)، پیشوند «سر» زایا و پیشوندهای «غیر» و «بر» نیمهزایا هستند. در پژوهش حاضر پیشوند «سر» در مرتبة زایاترین قرار ندارد بلکه میتوان گفت مانند دو پسوند «غیر» و «بر» در مرتبة نسبتاً زایا قرار دارد. بنابراین نتایج پژوهش حاضر با پژوهش مذکور چندان همسو نیست.
بنابر نظر بائر (2004) هرچه میزان زایایی بیشتر باشد، معنای واژه قابلپیشبینیتر است. در صورتهایی که زایایی بیشتری دارند، میتوان معنای واژه را از تکتک اجزای تشکیلدهنده تشخیص داد. «بی/ منفیساز، به معنای نبود چیزی»، «نا/ منفیساز، به معنای نبود چیزی» و «پُر/ به معنای کثرت»، زایاترین پیشوندها هستند. با بررسی نمونههای زیر که از پیکره استخراج شدهاند، میتوان سخن بائر را بررسی کرد: واژههای مرتبط با پیشوند «بی»: بیکار (بی+کار/ به معنای کسی که کار ندارد)، بیتوجه (بی+توجه/ به معنای کسی که توجه ندارد) و بینظیر (بی+نظیر/ به معنای بدون مانند). واژههای مرتبط با پیشوند «نا»: نادیده (نا+دیده/ به معنای چیزی که دیده نشده)، ناشنوا (نا+شنوا/ به معنای کسی که نمیشنود.) و ناخالص (نا+خالص/ به معنای خالص نبودن). از بررسی مثالهای بالا با وندهای زایا میتوان دریافت که درک معنای واژههای مذکور از اجزای تشکیلدهندة آنها، ممکن و قابلپیشبینی است. درخصوص وندهای غیرزایا نیز میتوان گفت: نمونههای تکبسامدی پیشوندهای «پیرا/ به معنای پیرامون چیزی» و «ور/ به معنای بَر، بیرون، فرا، بالا یا تأکید» برابر با صفر است و در جایگاه وندهای غیرزایا قرار دارند. از واژههای مرتبط با پیشوند «پیرا»، میتوان پیراپزشکی (پیرا+پزشکی) را نام برد. در این واژه نمیتوان بهطور دقیق گفت پیراپزشکی به رشتههای اطراف پزشکی اطلاق میشود. واژة اطراف در اینجا مبهم است. میتوان گفت پیراپزشکی به رشتههایی اطلاق میشود که وابسته به رشتۀ پزشکی هستند یا در واقع مربوط به حوزة پزشکی هستند. همچنین مثالی برای پیشوند «ور»، واژة ورشکسته (ور+شکست+ه) به معنای شخص مالباخته است. در این واژه، معنای کلی واژه هیچ ارتباطی با تکتک اجزای سازندة آن ندارد. بنابراین دربارهی زایایی پیشوندها و قابل پیشبینی بودن معنای این واژهها، نظر بائر مورد تایید قرار میگیرد.
تحلیل دیدگاه بائر (2004) را با توجه به میزان زایایی پسوندها نیز میتوان بررسی کرد. از زایاترین پسوندها میتوان به این موارد اشاره کرد: «ی (مصدرساز)»، «ه/ صفت فاعلی، صفت مفعولی و اسمساز»، «انه/ نشاندهندة شباهت، نسبت و لیاقت»، «ن (مصدرساز)»، «ساز/ به معنای سازندگی»، «دار/ به معنای دارندگی»، «نده/ گاهی در معنای فاعلی» و «گر/ نشاندهندة شغل یا انجام دهندة کاری». برخی از واژههای مرتبط با پسوند «گر» عبارتاند از: تماشاگر (تماشا+گر/ کسی که تماشا میکند)، شناگر (شنا+گر/ کسی که شنا میکند)، کارگر (کار+گر/ بهطور کلی یعنی کسی که کار میکند). برخی از واژههای مرتبط با پسوند «نده» عبارتاند از: نویسنده (نویس+نده/ کسی که مینویسد(فاعل))، راننده (ران+نده/ کسی که میراند (فاعل)) ضدعفونیکننده (ضد+عفونی+کن+نده/ چیزی که ضدعفونی میکند). در این موارد، معنی قابل پیشبینی است. واژههای مرتبط با پسوند «ساز»، ازجمله خودروساز (خودرو+ساز/ کسی که خودرو میسازد)، آیندهساز (آینده+ساز/ کسی یا چیزی که آینده را میسازد)، حاشیهساز (حاشیه+ساز/ کسی که حاشیه میسازد)، نیز معنایی قابل پیشبینی دارند. دربارۀ واژههای مرتبط با پسوند «دار» ازجمله مردمدار (مردم+دار کسی که با مردم خوب رفتار میکند)، باردار (بار+دار به کسی که بار دارد اما معمولاً به شخص آبستن میگویند نه هر کسی که باری دارد)، ادامهدار (ادامه+دار/ چیزی که ادامه دارد) معنای واژهها چندان قابل پیشبینی نیست.
از غیرزایاترین پسوندها نیز میتوان به این موارد اشاره کرد: «سر/ نشاندهندۀ زمان، مکان و اسم»، «ش (مصدرساز)»، «لا/ شبهپسوند صفت ساز»، «نا/ پسوند اسمساز و گاهی به معنای مکان»، «نشان/ وندواره به معنای نشانه»، «وا/ به معنای حفاظت و نگهبانی و نشاندهندة شغل»، «واره/ به معنای شباهت، دارندگی و لیاقت» و «وش/ به معنای شباهت». شایان ذکر است که برای برخی وندها نمیتوان معنای خاصی تعریف کرد. مانند وند «ش (مصدرساز)». با توجه به نمونههای زیر میتوان دریافت که نظر بائر دربارة ارتباط زایایی با پیشبینیپذیر بودن چگونه است: برخی از واژههای مرتبط با پسوند «نا»: تنگنا (تنگ+نا/ به معنای سختی)، مرتبط با پسوند «واره»: یادواره (یاد+واره/ مراسمی که برای تجلیل از شخصی برگزار میکنند)، جشنواره (جشن+واره/ مراسم همگانی)، الگوواره (الگو+واره)، گوشواره (گوش+واره/ آویز زینتی)، مرتبط با پسوند «وش»: مهوش (مه+وش/ مانند ماه)، پریوش (پری+وش/ مانند پری) و مرتبط با وند «وا»: نانوا (نان+وا/ کسی که نان میپزد)، پیشوا (پیش+وا/ پیشرو، سردسته).
هدف پژوهش حاضر، بررسی میزان زایایی وندهای اشتقاقی زبان فارسی با استفاده از معیار باین (2009) بود. ابتدا وندها از منابع مختلف گردآوری شدند. سپس، با استفاده از پیکرة بهروزشونده و با کمک یک دستور برنامهنویسی، وندها در پیکره جستوجو شدند. برای هر وند، تعدادی واژة نمونه جستوجو شد. در نتیجة بررسی واژههای نمونه و محاسبة میزان زایایی، زایایی پیشوندها و پسوندها اشتقاقی مشخص شد.
از میان پیشوندها «بی» زایاترین و غیرزایاترین «بل» و «پیرا» و «ور» هستند. از میان پسوندها نیز وند «ی (مصدرساز)» زایاترین و پسوند «سر» «وا»، «واره»، «وش» و دیگر وندهایی که زایایی آنها برابر با صفر است غیرزایاترین هستند.
در خصوص نظریه بائر (2004) دربارۀ ارتباط میان زایایی و قابل پیشبینی بودن معنا نیز باید گفت که اگرچه در اغلب موارد میتوان این نظریة را تایید کرد، در مواردی نیز همچون واژهای ساختهشده با پسوند زایای «دار» و پسوند غیرزایای «وش» این نظریه زیر سؤال میرود. در نتیجه اگرچه نظریة بائر در بیشتر موارد درست بهنظر میرسد؛ ولی موارد نقض آن نیز یافت میشود.
[1]. productivity
[2]. A. Laudanna and C. Burani
[3]. P. Kiparsky
[4]. Affixoid: morphological categories between stems and affixes, the so-called affixoids.
[5] . همآوا و همنویسه: دارای شکل نوشتاری و تلفظ یکسان ولی با معنای متفاوت.
[6]. A. Taylor and V. Evans
[7]. A. Renouf
[8]. COBUILD
[9]. G. Cannon
[10]. Merriam-Webster
[11]. O. Pustylnikov and K. Schneider-Wiejowski
[12]. R. Kreyer
[13]. W. Liu and H. Shen
[15]. A. Gatt and R. Fabri
[16]. Maltese
[17]. K. Denistia and R. H. Baayen
[18]. Leipzig Corpora
[19] . ویراویراست سامانهای هوشمند است که برای زبان فارسی، بهویژه برای نگارش و ویرایش زبان فارسی، ساخته شده است. این سامانه بخشهای مختلفی دارد که برای کسب اطلاعات بیشتر میتوان به نشانی اینترنتی https://viravirast.com مراجعه کرد.
[20]. Crawl
یک موتور جستوجو است که مشخص میکند کدام صفحات از داده یا پیکره مدنظر باید جستوجو شوند. موتور جستوجوی گوگل از همین نوع است.
[21]. Natural Language Tool Kit for python.
[22]. Python library for digesting Persian text.
[23]. Antconc
[24]. Lancsbox
[25]. realized word
[26]. potential word
[27]. Hapax legomena
[28]. General productivity