بررسی پیکره‌بنیاد زایایی وندهای اشتقاقی زبان فارسی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 کارشناس ارشد، گروه پژوهشی زبان شناسی رایانه ای، مرکز منطقه ای اطلاع رسانی علوم و فن آوری، شیراز، ایران

2 استادیار، گروه زبان شناسی رایانه ای، مرکز منطقه ای اطلاع رسانی علوم و فن آوری، شیراز، ایران

3 استادیار، گروه پژوهشی طراحی و عملیات سیستم ها، مرکز منطقه ای اطلاع رسانی علوم و فن آوری، شیراز، ایران

چکیده

صاحب‌نظرانی همچون بائر (2004) و باین (1992) زایایی را یک پیوستار می‌دانند. منظور از زایایی وندها، میزان قابلیت استفاده از یک وند در ساخت واژه‌های جدید است. با بررسی میزان زایایی، می‌توان ترکیب‌ها و واژه‌های بالقوة زبان را پیش‌بینی کرد. در پژوهش‌های انجام‌شده تاکنون، تعداد مختصری از وندها بررسی شده‌اند. برای بررسی تعداد وندهای بیشتر و نتیجه‌گیری جامع‌تر، پژوهش حاضر انجام شد. هدف این پژوهش، بررسی میزان زایایی پیشوندها و پسوندهای اشتقاقی زبان فارسی و ارائه تعدادی از وندواره‌های زبان فارسی بود. برای این منظور166 وند اشتقاقی، شامل 28 پیشوند و 72 پسوند و 66 پسوندواره، گردآوری شدند و محاسبۀ میزان زایایی پیشوندها و پسوندها، جداگانه انجام شد. وندها در قسمتی از پیکرة به‌روزشونده، جست‌وجو شدند. برای جست‌و‌جوی وندها از یک دستور برنامه‌نویسی به زبان پایتون استفاده شد. برای بررسی میزان زایایی، از شاخص ارزیابی باین (P*) (2009) استفاده شد. یافته‌های پژوهش نشان داد که زایاترین پیشوند «بی» و غیرزایاترین پیشوند «پیرا» است. همچنین، زایاترین پسوند «ی (مصدرساز)» غیرزایاترین پسوند «وش» است.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

A Corpus-based Study of the Productivity of Derivational Affixes in Persian

نویسندگان [English]

  • Parvaneh Kohanzad 1
  • Mohammadhadi Fallahi 2
  • Bahareh Pahlavanzadeh 3
1 MA. Student of Computational Linguistics, Regional information center for science and technology (RICeST), Shiraz, Iran
2 Assistant Professor, Department of Computational Linguistics, Regional Information Center for Science and Technology, Shiraz, Iran.
3 .Assistant Professor, Department of Design and System Operations, Regional Information Center for Science and Technology, Shiraz, Iran.
چکیده [English]

Abstract:
One of the most important aspects of word-formation is considered as productivity which is a continuum concept in morphology (Bauer, 1996, and Baayen, 2009). Booij (2007) says that the frequent process in word formation is derivation. To the best of the researchers’ knowledge, only a partial number of Persian derivational affixes have been investigated in previous studies so far. In this regard, the following corpus-based study is done to discuss more affixes of Persian language and to reach more comprehensive results. The current study tries to answer the following two questions: 1. What are the most and the least frequent affixes in Persian language? 2. Is there any relation between productivity and word meaning prediction? To fulfill the aims of the research, 166 affixes, consisting of 28 prefixes, 72 postfixes and 66 affixoids were collected by a python code which searches through the Monitor corpus. In this study, Baayen measurement (P*) was used to measure the productivity. Results of the study showed that the theory of Bauer (2004) about productivity and predictability of words is true in most cases but with few exceptions.
Keywords: Productivity, Affixes, Derivational, Prefix, Postfix, Affixoids, Baayen measurement.
 
Introduction:
 Productivity means the extent to which new words are produced using a particular affix with a considerable frequency (Aronoff, 1976; Lieber, 1981; Al and Booij, 1981; Bauer, 2004; Booij, 2007). Shaghaghi (2010) treats productivity as a process in which new words are produced using a frequent word-formation rule, and Bauer (2004) claims that the meaning of words created by productive affixes is more predictable. As a consequence, the potential words and actual words of a language can be distinguished by studying and measuring the productivity.
 Studying the productivity can be done through morphology and syntax. Considering syntax, an unlimited number of sentences can be produced due to syntactic rules. Regarding morphology, it is impossible to produce unlimited words due to limitations imposed on word-formation rules which are syntactic, phonetic, morphological, and semantic. Therefore, in order to study the productivity, classification of affixes is needed. In general, affixes are considered as conditioned morphemes, creating new words or creating other forms of already existing words (Tabatabaei, 2016). According to Samie et al (2008) there are two types of affixes: Derivational affixes and Inflectional affixes. Besides, there are other kinds of affixes in Persian language:

Affixoids, which are morphemes that are no longer used as free morphemes and can be used as affixes such as /pæɹæst/ in /vætænpæɹæst/. Having said that, /pæɹæst/ is a free morpheme that is used to function as a stem. The difference between such affixes and other derivational ones is that they can take conditioned morphemes as an affix and create new words.
There are some words that take a secondary meaning besides their former ones, over time, and function as affixes in words to create a different meaning. For example: word /šâh/ functioning as an affix in /šâhɹâh/ (Kalbasi, 2008).
Complex afiixes, which are those that can be combined to create new affixes. For example: /ân+h= ânɛh/.

Affixes investigated in this study, to measure the productivity, consist of all the above-mentioned types.
 
 Materials and Methods:
The population of the study consists of 166 Persian affixes, consisting of 28 prefixes and 72 postfixes, that were collected from different sources like Farshidvard (2013), Moein Dictionary and Kalbasi (2008). Moreover, a great portion of affixes was selected from Viravirast[1] which is a dataset of Persian affixes extracted from Persika[2] corpus and web using a crawler algorithm (viravirast.com). Furthermore, a section of a Monitor corpus[3] was selected Morgan rule. in order to find sample words for each affix.
Since there are four different affixes with one form and four different meanings in Persian language, having the context was necessary to differentiate the different types of that affix. Fir example: (ی/ i/ derivational, creating name), (ی/ i/ derivational, function like (-ness) in English), (ی/ i/ inflectional, for third singular), (ی/ i/ inflectional, functions like the determinator (a) in English). Therefore, Lancsbox[4] tool was also used to study this postfix through the context.
The research method consists of five stages. First, affixes were collected and divided into two groups of prefixes and postfixes. Second, the corpus was preprocessed. Third, affixes were searched through the corpus by a python code using NLTK and HAZM libraries. Fourth, the sample words for each affix were listed in an excel sheet. Fifth, nonwords were deleted and consequently, the related words were extracted.
To measure the productivity, Baayen general productivity measurement (P*) was used. P* = VN (1, c)/h. In this formula (VN) stands for hapax legomena for each affix and (h) stands for all hapax legomena for all affixes. Hapax legomena generally means words with one occurrence. Based on Baayen (2009) words with one frequency of occurrence are probably new words. Therefore, the higher the number of words with one frequency are, the more productive the process will be.
 
Discussion of Results and Conclusion:
The results of the current study, according to the Baayen's general productivity measurement, showed that among the Persian prefixes, "بی/ bi/" is considered as the most productive one and " پیـرا/ piɹâ/" and "ور/ væɹ/" are considered as the least productive ones. Also, among the Persian postfixes, "ی/ i/" is considered as the least productive one. Based on the study of Bauer (2004), the more frequent the affixes of words are, the more predictable their meaning will be. Results showed that the theory is accepted in most cases but some examples do not match. For example: (دار/ dâɹ/) is one of the productive affixes meaning (have), but the word /mæɹdomdâɹ/ does not mean to have people. It rather means humanitarianism, someone who behaves well to people.
 
[1] Viravirast is an automatic system for writing and editing Persian language.
[2] A Persian Corpus for Multipurpose Text Mining and Natural Language Processing.‎
[3] A Persian monitor corpus with different subject categories (2020-8-8).
[4] Lancsbox is one of corpus analysis tools.

کلیدواژه‌ها [English]

  • Productivity
  • Affixes
  • Derivational
  • Prefix
  • Postfix
  • Affixoids
  • Baayen measurement

. مقدمه

زایایی[1] از مباحث مهم در فرایند واژه‌سازی است. صاحب‌نظران معمولاً، زایایی را یک پیوستار می‌دانند (Bauer, 2004; Baayen, 1992). به عقیدۀ بوی (2007) به‌طور کلی فرایند اشتقاق، یک فرایند واژه‌سازی پرتکرار است. میزان قابلیت کاربرد یک وند در ساخت واژه‌های جدید را زایایی آن وند می‌گویند ( Aronoff, 1976 ; Lieber, 1981; Al, Booij, 1981; Bauer, 2004; Booij, 2007). همچنین، از منظر دیگری می‌توان گفت که زایایی، به معنای تکرر استفاده از یک قاعده در ساخت واژه‌های جدید است (شقاقی، 1389). سنجش میزان زایایی، کمک می‌کند تا واژه‌های بالقوة زبان را از واژه‌های بالفعل تشخیص بدهیم (شقاقی، 1389). بائر (2004) معتقد است هرچه میزان زایایی بیشتر باشد، معنای واژه قابل پیش‌بینی‌تر است. در صورت‌هایی که زایایی بیشتری دارند، می‌توان از معنای تک‌تک اجزای تشکیل‌دهندۀ واژه، به معنای کلی واژه پی برد. می‌توان زایایی را از منظر ترکیب یک وند با پایه‌های مختلف نیز، بررسی کرد. آرونوف (1994) معتقد است که ترکیب وندها با پایه به‌گونه‌ای است که وندهای با زایایی کمتر، با پایه‌های پربسامدتر و وندهای زایا، با پایه‌های کم‌بسامدتر ترکیب می‌شوند. لادانا و بورانی[2] (1985) نیز معتقدند بنابر دلیلی نامشخص، کلمات مرکبی که با پایه‌های پربسامد ساخته شده‌اند، در مقایسه با کلمات مرکبی که به‌طور کلی همان میزان بسامد را دارند؛ اما پایه‌های کم‌بسامدتری دارند، زودتر تشخیص داده می‌شوند. سنجش میزان زایایی، به شناخت واژه‌های بالقوۀ زبان کمک می‌کند و شناخت واژه‌های پرتکرار و بالقوۀ زبان، در زبان‌آموزی، بسیار مؤثر است. همچنین، با بررسی تعداد زیادی از وندها می‌توان به نتایج جامعی در خصوص زایایی وندها دست یافت. با توجه به پژوهش‌های پیشین در حوزة سنجش میزان زایایی، می‌توان گفت پژوهش‌های کمی به بررسی این تعداد وند (نسبت به پژوهش حاضر)، پرداخته‌اند. در این پژوهش که پژوهشی پیکره‌بنیاد است، هدف، بررسی میزان زایایی وندها از منظر میزان بسامد و محاسبة میزان زایایی با معیار باین است. در پژوهش حاضر به این پرسش‌ها پاسخ خواهیم داد:

  1. زایاترین و غیرزایاترین پیشوندها و پسوندهای زبان فارسی کدام‌اند؟
  2. میان زایایی و قابل پیش‌بینی بودن معنای واژه چه ارتباطی وجود دارد؟

مفهوم زایایی، در صرف و نحو مطرح شده است؛ با این تفاوت که در حوزة نحو به دلیل استفاده از قواعد نحوی می‌توان جملات نامحدودی تولید کرد؛ اما در حوزة صرف، قواعد صرفی و محدودیت‌های ناظر بر آن، اجازة تولید بی‌نهایت واژه را نمی‌دهند. شقاقی (1389) معتقد است زایایی به معنای استفادة مکرر از یک فرایند است. همچنین، وی معتقد است چنانچه یک فرایند ساخت‌واژی بتواند با تمام پایه‌ها از تمام مقوله‌ها ترکیب شود، آن فرایند زایاست؛ اما چنین فرایندی بسیار نادر است. از دیگرسو، آرونوف (1976) معتقد است زایایی به معنای قابلیت استفاده از یک وند در ساخت واژه‌های جدید (نوواژه) است. براساس نظر شقاقی (1389)، می‌توان گفت میزان زایایی را می‌توان از بسامد واژه‌های موجود ساخته‌شده با یک وند در پیکره به دست آورد. برای بررسی میزان زایایی از منظر آرونوف (1976)، اطلاعات این پیکره به دلیل هم‌زمانی بودن، کافی نیست. همچنین، بسامد واژه‌های موجود در پیکره، دربارۀ میزان ساخت نوواژه‌ها اطلاعاتی نمی‌دهند.

اگر زایایی یک وند به معنای ترکیب یک وند با تمام مقوله‌ها باشد، آیا می‌توان چنین وندی را مشخص کرد؟ آیا می‌توان گفت که به‌طور کلی ترکیب یک وند با تمام مقوله‌ها ممکن است؟ برای پاسخ‌گویی به این پرسش‌ها باید محدودیت‌های ناظر بر فرایندهای واژه‌سازی را بررسی کرد. از محدودیت‌های ناظر بر فرایندهای ساخت‌واژی می‌توان محدودیت‌های نحوی، آوایی، صرفی و معنایی را نام برد.

  1. محدودیت نحوی: بائر (1988) معتقد است در زایایی، درونداد اهمیت زیادی دارد. فرایندهای ساخت‌واژی بر هر ستاکی اعمال نمی‌شوند. شقاقی (1389) معتقد است وندهای اشتقاقی تنها با برخی از پایه‌ها ترکیب می‌شوند، مانند وند «ه» که به ستاک افعال مضارع می‌چسبد؛ مانند: خند+ه=خنده.
  2. محدودیت آوایی: ساخت واجی، هجایی و جایگاه تکیۀ ستاک، محدودیتی برای ترکیب وندها با پایه است.
  3. محدودیت صرفی: از نگاه صرفی نیز می‌توان گفت که برخی وندها تنها با پایه‌های معینی ترکیب می‌شوند.
  4. محدودیت معنایی: کیپارسکی[3] (1982) معتقد است به دلیل اصل ممانعت از هم‌معنایی برای واژه‌های موجود، صورت جدید ساخته نمی‌شود. به بیان واضح‌تر، زبان، دو واژه با معنای دقیقاً یکسان را نمی‌پذیرد. حتی اگر در زبان به دلیل وام‌گیری یا ورود واژه‌های بیگانه، چندین واژه برای اشاره به یک مفهوم به وجود بیایند، در گذر زمان گویشوران آن زبان، برای هر واژه بار معنایی متفاوتی در نظر می‌گیرند (Kurylowicz, 1960).

درخصوص وندها باید گفت، وندها تکواژهایی وابسته هستند که به یک پایه افزوده می‌شوند و منجر به ساخت واژه‌ای جدید یا صورت دیگری از واژة اصلی می‌شوند (طباطبایی، 1395).

به‌طورکلی، وندها در ساخت واژه‌های مشتق و افعال پیشوندی کاربرد دارند. همچنین، وندها دو دسته‌بندی کلی دارند (سمیعی و همکاران، 1387): وندهای اشتقاقی و وندهای تصریفی.

در کنار این دو دسته، دسته‌بندی‌های دیگری نیز برای وندها وجود دارد:

  1. وندواره: وندواره[4] به وندهایی گفته می‌شود که از یک‌سو مانند واژه و از سوی دیگر مانند وندها عمل می‌کنند. برای مثال، ستاک «پرست» را در نظر بگیرید. این ستاک در واژه‌ای مانند «وطن‌پرست» به‌عنوان وند به کار رفته‌ است. ستاک «پرست» به‌تنهایی کاربرد مستقل ندارد. تفاوت اصلی آن‌ها با وندها در این است که ستاک افعال، وند اشتقاقی و تصریفی می‌پذیرند؛ مانند «پرستار» (طباطبایی، 1395). وندواره اصطلاحی ‌است که در بین زبان‌شناسان چندان شناخته‌شده نیست و به‌ وجود آمدن وندواره‌ها، ریشة تاریخی دارد. ابراهیمی (1373) معتقد است در دورۀ میانه واژه‌سازی با دو فرایند وندافزایی و ترکیب شکل گرفته است. وی (1373) معتقد است بسیاری از وندهای باستانی در دورۀ میانه سترون یا عقیم شدند؛ بنابراین، با استفاده از فرایند ترکیب این کمبود جبران شده است. به عقیدۀ ابراهیمی (1373) با گذشت زمان وندها، مفاهیم اولیۀ خود را از دست دادند. این مسئله در دورۀ نو به اوج رسیده است. بنابراین، برای جبران این کمبود راه‌هایی جایگزین شده است: 1. با به‌کارگیری تعدادی از حروف اضافه و قیدها و کلمات مستقل به‌جای وندهای ازدست‌رفته؛ 2. استفاده از فرایند ترکیب. از منظر کشانی (1371) در زبان فارسی ماده‌های فعلی وجود دارند که علاوه‌بر ریشه بودن نقش پسوند را بازی می‌کنند مانند «خیز، شناس، فروش و گیر»؛ زیرا این گروه ریشه‌ها چه از نظر واژه‌سازی و چه از نظر خصلت میدان لغوی نقشی مشابه پسوندها ایجاد می‌کنند. همچنین، وی (1371) بر این نکته واقف است با وجود و قبول پسوندواره‌ها در تشخیص واژه‌های پسوندی از واژه‌های مرکب با مشکل روبه‌رو خواهیم بود. وی (1371) معتقد است اگرچه پذیرفتن ماده فعلی به‌عنوان پسوند با معیار غیرمستقل بودن وند سازگار نیست، حذف آن‌ها برابر است با حذف میزان درخور توجهی واژه در فرهنگ معین که با کمک پسوندواره‌ها به وجود آمده‌اند. وی (1371) برای تفکیک قائل شدن میان پسوندها و پسوندواره‌ها، پسوندها را در دستۀ وندهای اصلی و پسوندواره‌ها را در دستۀ وندهای حقیقی بررسی می‌کند. با توجه به نظریات افراد مختلف و مشکلاتی که در طرح عنوان «پسوندواره» وجود دارد به نظر می‌رسد با حذف ستاک‌هایی که هنوز به‌صورت مستقل کاربرد دارند و حفظ ستاک‌هایی که به‌تنهایی کاربرد ندارند با مشکلات کمتری روبه‌رو خواهیم بود. برای مثال، تشخیص میان واژه‌های مرکب از واژه‌های پسوندی راحت‌تر خواهد بود. اگر واژه‌ای با ستاکی ترکیب شده بود که دیگر کاربرد مستقل ندارد آن را واژۀ مرکب پسوندی و اگر واژه‌ای با ستاکی ترکیب شده بود که همچنان کاربرد مستقل دارد، آن را واژۀ مرکب بدانیم. در این پژوهش این دیدگاه در نظر گرفته شده است.
  2. شبه‌وند: برخی کلمات با گذشت زمان علاوه‌بر معنای اولیة خود، معنای دیگری هم پیدا می‌کنند. بدین صورت که به‌عنوان وند با واژة بسیط ترکیب می‌شوند. مانند وندهای «آباد» و «شاه» در «سعادت‌آباد» و «شاهراه» (کلباسی، 1387). فرشیدورد (1392) شبه‌ضمیمه یا شبه‌وند را واژۀ مستقلی می‌داند که با گذر از معنا تهی و غیرمستقل و تبدیل به وند شده است.
  3. وندهای مرکب: فرشیدورد (1392) معتقد است وندها نیز مانند واژه‌ها از دو نوع بسیط و غیربسیط تشکیل شده‌اند. وندهای بسیط وندهایی هستند که از یک جزء تشکیل شده‌اند؛ مانند وند «مند» در واژة «آبرومند». وندهای غیربسیط وندهایی هستند که از دو جزء تشکیل شده‌اند؛ مانند وند «انه» در واژة «آبرومندانه» که از ترکیب دو وند مستقل «ان+ه» تشکیل شده است.

 برخی وندها هم‌آوا و هم‌نویسه[5] هستند؛ مانند: «خر/صفت/پیشوند» در واژۀ «خرپول» و «خر/بن/پسوند» در واژۀ «شرخر».

در پژوهش حاضر تعدادی از پسوندواره‌های زبان فارسی ارائه شدند. پژوهشگرانی همچون کشانی (1371) معتقدند وندواره‌ها نیز مانند وندها از ویژگی زایایی برخورداراند؛ اما در بررسی میزان زایایی تنها پیشوندها و پسوندها و برخی شبه‌وندها آورده شده‌اند. بررسی میزان زایایی و محاسبات آماری بر پسوندواره‌ها انجام نشده است.

 

2.                  پیشینة پژوهش

در پژوهش عباسی (1385)، محدودیت‌های صرفی و نحوی در زایایی فرایند اشتقاق در زبان فارسی بررسی شده است. در این پژوهش با استفاده از معیار باین و بائر ( Baayen, 1994 ; Bauer, 2004) و با پیکره‌ای متشکل از متون ادبی ادبیات معاصر فارسی، تعدادی از محدودیت‌های صرفی و نحوی بررسی شده‌اند. در نتیجۀ این پژوهش، مشخص شد میان محدودیت‌های صرفی و نحوی و میزان زایایی، رابطۀ معکوس وجود دارد. هرچه تعداد محدودیت‌ها بیشتر باشد، میزان زایایی کمتر است. در پژوهش عابدینی و همکاران (1398) با استفاده از پیکرة همشهری و معیار باین، پیشوندهای اشتقاقی بررسی شده‌اند. نتایج پژوهش نشان داد که پیشوند «غیر»، زایا و پیشوند «بل»، غیرزایاست. پژوهش فراگردی (1389) پیشوندهای کاربردی زبان فارسی، نقش پیشوندهای اشتقاقی در ساخت واژه، مقایسة پیشوندهای تصریفی و اشتقاقی از منظر نزدیکی با پایه بررسی کرده است. وی چنین نتیجه‌گیری کرده است که پیشوند «سر»، زایا و پیشوندهای «غیر» و «بر»، نیمه‌زایا هستند. شریفی و عرفانیان قونسولی (1390) با استفاده از چهار متن با موضوع سفرنامه (پرستو در قاف، سفرنامۀ شمس آل‌احمد در آلمان و اسپانیا، سفرنامۀ فرنگ، اقلیم‌های دیگر) و استخراج 700 واژه، میزان زایایی وندهای اشتقاقی را با استفاده از معیار باین محاسبه کرده‌اند. نتیجه چنین حاصل شد که وندهای «ی/ نسبت»، «ی، مصدری» و «ه»، بیشترین زایایی و وندهای «مان»، «در»، «سان»، «با»، «واده»، «فرا»، «وا»، «ال» و «وند»، کمترین زایایی را داشته‌اند. در پژوهش محمدی (1390)، تعداد محدودی از پیشوندها و پسوندهای اشتقاقی بررسی شده است. وی پیشوند «هم» و پسوندهای «ش»، «ی/ نسبت» و «گاه» را زایاترین دانسته است. ذهاب ناظوری و همکاران (1398) در پژوهشی، «پیشوندواره‌های زبان فارسی: تحلیلی شناختی»، با بهره‌بری از پیکرۀ انوری (1381) پیشوندواره‌های «خوش- و بد-» را با در نظر گرفتن سه عملیات شناختی «مقوله‌سازی»، «پیکربندی» و «مفهوم‌سازی» بررسی کرده‌اند. نتیجۀ پژوهش چنین است که پیشوندها و پیشوندواره‌ها نیز مانند تمام عناصر زبانی دارای مفاهیمی هستند که نشان‌دهندۀ تجارب ذهنی متفاوت سخنوران زبان هستند. در پژوهش افراشی و کوشکی (1397) با استفاده از معیار تایلر و ایوانز[6] (2003) با تحلیل معناشناختی پیشوند (پیش-)، دو خوشۀ معنایی مرکزی ترتیب زمانی و ترتیب مکانی برای این وند مشخص شده است.

پژوهش باین و رنوف[7] (1996) با استفاده از پیکرة کوبیلد[8] و معیار باین انجام شد و نتیجه چنین شد که پیشوند «Un» و پسوندهای «ly» و «ness» در زبان انگلیسی، وندهایی زایا هستند. پژوهش کانن[9] (1988) با استفاده از پیکرة مریم ‌وبستر[10] نیز نشان داد که پسوند «ly»، پسوندی غیرزایاست. پژوهش پوستیل‌نیکاو و اِشنایدر-ویووسکی[11] ( 2009) به بررسی وندهای اسم‌ساز در زبان آلمانی با استفاده از دو پیکرة نوشتاری از متون روزنامه‌ای و یک پیکرة گفتاری پرداخت. این پژوهش به مقایسة دو معیار زایایی از باین ( 1991 , 1992) و یک معیار زایایی از کریر[12] ( 2008) پرداخت و در نتیجة بررسی سه معیار، آنان نتایج مشابهی در تفکیک وندهای زایا از غیرزایا به دست آوردند. لیو و شن[13] (2012) به بررسی پسوند (–esque) به‌صورت پژوهشی پیکره‌بنیاد پرداختند. آنان با استفاده از پیکرة کوکا (COCA[14]) به این نتیجه رسیدند که وند مذکور از جمله وندهای زایایی است که در متون رسمی کاربرد دارد و کاربرد آن در ترکیب با اسم برای ساخت صفت، دیده شده است. گات و فابری[15] (2018) با بررسی وندهای «-vr» و «-z» که دو وند وام‌گرفته در زبان مالتسی[16] هستند، با استفاده از معیار باین به این نتیجه رسیدند که اگرچه هر دو وند زایا هستند؛ اما وند «-vr» در ساخت واژه‌های جدید پرکاربردتر است و منجر به ساخت صورت‌های اسمی ساده‌تری می‌شود و صورت‌های اسمی ساده‌تر معمولاً زایاترند. در پژوهش دنسیتا و باین[17] ( 2019)، با استفاده از بخشی از پیکرة نوشتاری لیپزیگ[18] و با استفاده از معیار باین، وندهای «pe-» و «pen-» که وندهای اسم‌ساز هستند، بررسی شدند. در ابتدای پژوهش به‌نظر می‌رسیده که این دو وند تکواژگونه‌های یکدیگرند؛ اما نتیجه چنین حاصل شد که این دو، وندهای جداگانه‌ای هستند و پیشوند «pen»، پرکاربردتر است.

 

3. روش پژوهش

جامعة آماری این پژوهش، کلیه‌ی وندهای اشتقاقی زبان فارسی است. پیشوندها و پسوندهای اشتقاقی از منابع مختلفی همچون فرشیدورد (1392)،  فرهنگ معین (معین، 1386) و کلباسی (1387) گردآوری شدند. همچنین، بخش درخور توجهی از وندها برگرفته از مجموعه داده‌های گروه ویراویراست[19] است (رحمانی و همکاران، 1399). وندهای ویراویراست از منابعی همچون پیکرة پرسیکا و سراسر وب به روش خزش[20] استخراج شده‌اند. نمونه‌های این پژوهش نیز کلیة وندهای زایا و غیرزایای زبان فارسی است که از منابع مذکور جمع‌آوری شده است. شایان  ذکر است تمام وندهای موجود در منابع نام‌برده، مورد استفاده قرار نگرفته‌اند و سعی شده است تا وندهای مرده و عقیم (سترون) حذف شوند. با استناد به فرشیدورد (1392: 269- 527)، برخی از وندها که پیش‌تر در متون قدیمی یا شاهنامه کاربرد داشته‌اند و اکنون دیگر کاربردی ندارند، مرده محسوب می‌شوند (مانند: وند «یش» در خریش به معنای خلیده). همچنین، وندهایی هستند که در ساخت کلمات جدید به‌کار نمی‌روند؛ اما کلماتی که پیش‌تر از ترکیب با این وندها ساخته شده است، مورد استفاده قرار می‌گیرند و آن‌ها را وندهای سترون می‌نامیم (مانند وند «یک» در نزدیک).

برای جست‌وجوی واژه‌های نمونه برای هر وند، از پیکرة به‌روزشونده (مولودی و رضایی شریف‌آبادی، 1399) به‌عنوان منبع استفاده شده است (دسترسی از www.peikare.ir, 7/9/2021). پیکرۀ به‌روزشوندۀ پارسی پیکره‌ای است برخط که با جست‌وجوی واژه یا عبارت مورد نظر، می‌توان نمونه‌های فراوانی از کاربرد آن را در متون فارسی مشاهده کرد. هر روز متون جدید از خبرگزاری‌های معتبر به پیکره اضافه می‌شوند. بنابراین، می‌توان واژه‌های جدید مثل «برجام»، «برگزیت»، «اسپینر» و ... را هم در آن دید. نکتۀ دیگر آنکه، هر روز از شش دستۀ موضوعی «سیاسی»، «اقتصادی»، «اجتماعی»، «فرهنگی»، «علمی» و «ورزشی» به مقدار مساوی متن به پیکره اضافه می‌شود. این به آن معناست که پیکره از نظر موضوعی همواره متوازن است و می‌توان نوع و میزان کاربرد واژه یا عبارت مورد نظر را در دسته‌های موضوعی مختلف نیز بررسی کرد.

در این پژوهش با در دست داشتن نسخۀ غیربرخط و تمام دسته‌بندی‌های موضوعی پیکره، از میان 4538 پوشه، معادل 13/1 گیگابایت از تاریخ 29/12/1396 تا تاریخ 18/05/ 1399، با فرمول مورگان و با احتساب 10 درصد خطای فرمول، تعداد 354 پوشه برای بررسی و استخراج واژه‌ها، انتخاب شد. در هر پوشه 5685 واژه وجود دارد. پس از جست‌وجوی وندها در پیکره، برای پیشوندها 14503 واژه جست‌وجو شد که پس از حذف واژه‌های نامرتبط، 4311 واژه باقی ماند. همچنین، برای پسوندها نیز در ابتدا، 37836 واژه جست‌وجو شد که پس از بررسی و حذف واژه‌های نامرتبط، 18062 واژه باقی ماند.

وندهایی که در پژوهش حاضر مورد بررسی قرار گرفته‌اند، در دو دستۀ پیشوند و پسوند در جدول‌های ذیل نمایش داده شده‌اند:

 

جدول 1- پیشوندها

Table 1- Prefixes

ابر

بلا

بی

پر

پیرا

تک

دژ

فر

نا

هم

با

بر

پاد

پس

پیش

خر

سر

فرا

وا

 

باز

بُل

پارا

پسا

ترا

در

غیر

فرو

ور

 

 

جدول 2- پسوندها

Table 2- Suffixes

­­اً (تنوین به روی الف)

انه

تا

سَرا

فرسا

گرا

نده

ینه

ا

آسا

چه

سا

فروز

گسار

وا

یه

اُم

آگین

چی

سار

فشان

گون

وار

 

اُمین

باره

خانه

سان

ک

گونه

واره

 

ا (افسوس)

باز (اسم‌ساز)

خوار

ستان (مکان)

کار

لا

ور

 

ا (ندا)

بان

دان

سر

کده

لاخ

وش

 

اد

بخت

دیس

سیر

گار

مند

ه

 

ار

بد

زاد

ش (مصدرساز)

گاه

ن

ی (مصدرساز)

 

اک

بس

زار

شاه

گداز

نا

ی (نسبت)

 

اکی

بند

زده

فام

گر

ناک

یار

 

 

همچنین، تعدادی از وندواره‌های زبان فارسی در جدول زیر ارائه شدند:

 

 

 

جدول 3- وندواره‌ها

Table 3- Affixoids

افراز

باش

پرور

خوان

زدا

گذار

نشین

افروز

باف

پز

خواه

ساز

گرد

نگار

افزا

بخش

پژوه

خور

سپار

گزار

نما

افشان

بر

پوش

خیز

سنج

گزین

نواز

انداز

برانگیز

پیما

دار

 

گستر

نورد

اندوز

بین

تراش

دان (دانستن)

شمار

گشا

نویس

انگیز

پذیر

جو

رس

شناس

گو

یاب

آموز

پر

چران

ریز

کُش

گیر

 

آمیز

پرداز

چین

زا

کِش

نشان

 

آور

پرست

خر

زد

کار (کاشتن)

نشناس

 

 

عمل جست‌وجو با استفاده از یک دستور برنامه‌نویسی به زبان پایتون، نسخة 3 و همچنین، فراخوانی کتاب‌خانه‌های NLTK[21] و HAZM[22] انجام شد. در دستور برنامه‌نویسی، نخست، پیکرة دریافت‌شده پیش‌پردازش شد، سپس پیشوندها و پسوندها در پوشه‌های جداگانه توسط برنامه، دریافت شدند و سپس واژه‌های مرتبط با پیشوندها و پسوندها نیز همراه با بسامدشان در دو پوشۀ جداگانه، در قالب فایل excel فهرست شدند. نرم‌افزارهای واژه‌نمایی همچون انت‌کانک[23] و لنکس‌باکس[24] نیز می‌توانند با دریافت پیکره و فهرست وندها، عمل جست‌وجو را انجام دهند؛ اما به دلیل زیاد بودن تعداد وندها، عدم امکان پردازش با سیستم‌های خانگی و زمان‌بر بودن، یک دستور برنامه‌نویسی جایگزین شد (برای مدیریت زمان).

در بخشی از پژوهش برای بررسی و تفکیک پسوند «ی» به چهار نوع مصدرساز، نسبت، نکره، شناسه و کاربرد «ی» به‌جای همزه، به متن پیکره نیاز بود. بدین منظور از نرم‌افزار لنکس‌باکس کمک گرفته شد. وند مربوطه در قسمتی که برای جست‌وجو تعبیه‌شده جست‌وجو می‌شود سپس، واژه‌هایی که در آن‌ها وند مدنظر به‌کار رفته‌اند به‌همراه متن‌شان نمایان می‌شوند. با دسترسی به متن می‌توان به‌راحتی نمونه‌های مورد نیاز را بررسی کرد. برای مثال، پس از جست‌وجوی وند «ی» واژۀ «حسابرسی» برگردانده شد. با بررسی جملات مربوطه نکره یا مصدرساز بودن وند «ی» مشخص شد: «معاون امور شرکت‌های مؤسسه در پاسخ به سؤال نحوۀ ادارۀ شرکت‌ها و حسابرسی /(مصدرساز)/ آن‌ها گفت: شرکت‌های زیرمجموعه صندوق ذخیره همگی دارای سال مالی هستند.» به علت بسامد بالای وند «ی» از واژه‌های نمونة این وند، با استفاده از فرمول مورگان نمونه‌گیری شد و نمونه‌ها بررسی شدند. «ی» شناسة دوم شخص، «ی» نکره و «ی» در کاربرد همزه به دلیل نامرتبط بودن، حذف شدند. به‌طور کلی، پس از جست‌وجوی واژه‌های نمونه برای هر وند، در میان واژه‌های جست‌وجوشده، واژه‌های نامرتبطی وجود داشت که به روش دستی، بررسی و حذف شدند. منظور از واژه‌های نامرتبط واژه‌هایی است که به علت غلط املایی از نوع جابه‌جایی، بی‌معنا شده‌اند (مانند: قدرتمند/ *قدرمتند) یا در آن‌ها وند مدنظر در واقع به عنوان وند به کار نرفته است (مانند: سمپاد/ واژة سمپاد یک سرواژه است و وند «پاد» در آن به کار نرفته است). همچنین، از آنجا که پژوهش حاضر پژوهشی هم‌زمانی است، واژه‌هایی که بررسی آن‌ها به بررسی تاریخی نیاز داشت، حذف شدند. بسامد واژه‌های جست‌وجوشده پس از بررسی و تفکیک، همراه با هر وند آورده شده است. همچنین، نکتة دیگری که در برچسب‌زنی وندها به آن توجه شد این بود که هر واژه ممکن است با بیش از یک‌وند، ترکیب شده باشد. در برچسب‌زنی تنها به پایه و وند مد نظر توجه شده است. همچنین، بروندادهای ترکیب هر وند با پایه‌های مختلف، ممکن است به چند مقولة دستوری تعلق داشته باشد؛ بنابراین، با توجه به متن و واژه‌های نمونه، ممکن است هر وند بیش از یک برچسب داشته باشد. برای مثال، برونداد ترکیب وند «باز» با پایة «گشت» می‌تواند اسم یا فعل یا هر دو باشد.

برای بررسی میزان زایایی صرفی، روش‌های متعددی وجود دارد. در این بخش به سه روش مهم اشاره می‌شود و علت روش انتخابی در این پژوهش، مشخص می‌شود:

 

  1. محاسبة میزان زایایی برحسب واژه‌های ممکن: یکی از روش‌های محاسبة شاخص زایایی، برابر است با تقسیم واژه‌های موجود ساخته‌شده با یک وند[25] بر تعداد واژه‌های ممکن ساخته شده با همان وند[26] . از نظر آرونوف (1976) منظور از واژه‌های موجود، واژه‌هایی است که در پیکره وجود دارند و وند مربوطه در آن‌ها به‌کار رفته است. همین‌طور، منظور از واژه‌های ممکن تمام واژه‌هایی است که قابلیت ساخت با وند مربوطه را دارند؛ اما در پیکرۀ بررسی‌شده، وجود ندارند. به علتفرایندهای ناظر بر ساخت‌واژی، برآورد تعداد واژه‌هایی که می‌توانند با یک وند ترکیب شوند، ممکن نیست. این موضوع از مشکلات اساسی این روش است. بنابراین، استفاده از این روش برای پژوهش حاضر، ممکن نیست.

در فرمول زیر «I» همان شاخص زایایی و «v» تعداد واژه‌های موجود و «s» تعداد واژه‌های ممکن است.

I=v/s

 

  1. سنجش میزان زایایی با واژه‌های تک‌بسامدی: یکی از روش‌های محاسبة میزان زایایی برابر است با تعداد کل واژه‌های تک‌بسامدی ساخته‌شده با یک وند، تقسیم بر کل واژه‌های موجود ساخته‌شده با آن وند در پیکرة باین (2009). در این روش، نتیجۀ به‌دست‌آمده بستگی به اندازه و بزرگی پیکره دارد. اندازة پیکره‌هایی که در پژوهش‌های متفاوت استفاده شده‌اند، یکسان نیست؛ بنابراین، نمی‌توان نتیجة پژوهش حاضر را با نتایج پژوهش‌های دیگر مقایسه کرد. بنابراین، از این روش نمی‌توان در پژوهش حاضر استفاده کرد. به گفتۀ باین (2009) در این معیار، واژه‌های تک‌بسامدی، واژه‌های جدید‌ هستند. بنابراین، هرچه تعداد واژه‌های تک‌بسامدی بیشتر باشد، نشان‌دهندۀ زایایی آن فرایند است.

در فرمول زیر، (P)، همان شاخص زایایی، (V)، تعداد واژه‌های تک‌بسامدی ساخته‌شده با یک وند و (N) تعداد کل واژه‌های مرتبط با آن وند در پیکره است.

P= VN (1)/N

 

  1. محاسبة میـزان زایـایی یـک فراینـد سـاخت‌واژی خـاص در مقیاس بـا زایـایی سـایر فرایندهای ساخت‌واژی موجود در پیکره: در این روش، شاخص زایایی برابر است با واژه‌های تک‌بسامدی[27] ساخته‌شده با یک فرایند ساخت‌واژی خاص، تقسیم بر کل نمونه‌های تک‌بسامدی (Baayen, 2009). در این روش تمام اطلاعات خواسته‌شده برای محاسبه، در پژوهش حاضر فراهم است. امکان مقایسه و تشکیل پیوستار وجود دارد. بنابراین، در پژوهش حاضر از این روش برای محاسبة میزان زایایی استفاده شده است. در این معیار نیز واژه‌های تک‌بسامدی واژه‌های جدید هستند. منظور از واژه‌های جدید واژه‌هایی هستند که با پایه‌ای جدید ترکیب شده‌اند. اگرچه این تنها یک احتمال است و ممکن است واژه‌ای با بسامد 1 الزاماً واژه جدیدی (نوواژه)، نباشد.

در فرمول زیر، (P*) نشانة زایایی کلی،[28] (v) واژه‌های تک‌بسامدی با یک فرایند خاص و (h) تعداد کل نمونه‌های تک‌بسامدی است.

P* = VN (1,c)/h

محاسبات در برنامه excel انجام شد.

 

4. تحلیل و بررسی یافته‌های پژوهش

در محاسبة میزان زایایی وندها، با استفاده از معیار باین، به نمونه‌های تک‌بسامدی ساخته‌شده با هر وند و مجموع نمونه‌های تک‌بسامدی تمام وندها، نیاز داریم. منظور از نمونه‌های تک‌بسامدی، نمونه‌هایی است که بسامدشان برابر با عدد 1 است؛ برای مثال، در بررسی پیشوند «باز» بسامد واژۀ «بازخور» برابر با 1 است. این بدین معناست که این واژه در جست‌وجو، تنها یک‌بار یافته شده است. برای بررسی میزان زایایی، پیشوندها و پسوندها را جداگانه محاسبه می‌کنیم. ابتدا به بررسی محاسبات انجام‌شده بر روی پیشوندها می‌پردازیم:

نمونه‌های تک‌بسامدی مربوط به هر پیشوند در جدول (4) نشان داده شده است. مجموع نمونه‌های تک‌بسامدی کل پیشوندها، برابر با 1458 عدد است.

با تقسیم نمونه‌های تک‌بسامدی هر وند بر تعداد نمونه‌های تک‌بسامدی کل وندها، اعداد ستون پنجم به‌دست آمده است. در ستون ششم اعداد حاصل از تقسیم نمونه‌های تک‌بسامدی هر وند بر نمونه‌های تک‌بسامدی کل وندها P*(v/h)، برحسب درصد محاسبه شده‌اند. وندها براساس میزان زایایی مرتب شده‌اند.

 

 

 

 

جدول 4- محاسبۀ زایایی پیشوندها

Table 4- Productivity of prefixes

وند

بسامد

کارکرد

 (v)نمونه‌های تک‌بسامدی

P*(v/h)

بر حسب درصد

بی

6005

منفی‌ساز/ صفت‌ساز

226

0/155

15/5

نا

10577

منفی‌ساز/ اسم‌ساز/ صفت‌ساز

173

0/1186

11/86

پُر

3519

صفت‌ساز

138

0/0946

9/46

هم

50481

اسم‌ساز/ صفت‌ساز/ قیدساز

132

0/0905

9/05

بر

33262

فعل‌ساز/ اسم‌ساز

129

0/0884

8/84

غیر

4790

منفی‌ساز/ صفت‌ساز

116

0/0795

7/95

سر

17895

اسم‌ساز

104

0/0713

7/133

باز

16722

فعل‌ساز/ اسم‌ساز

97

0/0665

6/65

پیش

11244

اسم‌ساز/ صفت‌ساز

79

0/0541

5/41

فرا

3978

اسم‌ساز/ صفت‌ساز/ فعل‌ساز

47

0/0322

3/22

در

23233

فعل‌ساز/ اسم‌ساز

42

0/0288

2/88

تک

199

اسم‌ساز/صفت‌ساز

33

0/0226

2/26

با

741

صفت‌ساز

33

0/0226

2/26

وا

8388

فعل‌ساز/ اسم‌ساز

27

0/0185

1/85

فرو

617

اسم‌ساز/ صفت‌ساز/ فعل‌ساز

23

0/0157

1/577

پس

837

اسم‌ساز

11

0/0075

0/7544

فر

2350

اسم‌ساز

11

0/0075

0/7544

ابر

89

صفت‌ساز

8

0/0054

0/5486

پارا

1557

اسم‌ساز

8

0/0054

0/54

بلا

1142

صفت‌ساز

7

0/0048

0/48

پسا

719

اسم‌ساز

6

0/0041

0/41

پاد

176

اسم‌ساز

3

0/002

0/2

ترا

312

صفت‌ساز

3

0/002

0/2

خر

35

اسم‌ساز

1

0/0006

0/06

دژ

194

صفت‌ساز

1

0/0006

0/06

پیرا

75

اسم‌ساز

0

0

0

ور

61

اسم‌ساز/ صفت ساز/ فعل‌ساز

0

0

0

بل

0

صفت‌ساز

0

0

0

 

جدول (4) نشان می‌دهد که زایاترین پیشوند «بی» و غیرزایاترین پیشوندها آن‌هایی هستند که محاسبه زایایی آن‌ها برابر با صفر است؛ مانند «بل»، «پیرا» و «ور». عدد صفر بدین معناست که این وندها نمونه‌های تک‌بسامدی ندارند. همان‌طور که پیش‌تر اشاره شد، نمونه‌های تک‌بسامدی نشان‌دهندۀ واژه‌های جدید هستند. بنابراین، می‌توان گفت از وندهایی که نمونه‌های تک‌بسامدیشان برابر با صفر است، در ساخت واژه‌های جدید استفاده نمی‌شود. درخصوص وندهایی که بسامد کلی واژه‌های نمونه با این وندها، صفر نیست، می‌توان گفت کلماتی که از پیش با این وندها ساخته شده‌اند، هنوز کاربرد دارند؛ بنابراین، وند غیرزایا محسوب می‌شوند و نه وند مرده یا عقیم. در جدول (5) محاسبة زایایی پسوندها آورده شده است.

نمونه‌های تک‌بسامدی کل پسوندها، برابر با 2319 عدد است.

 

جدول 5- محاسبة زایایی پسوندها

Table 5- Productivity of suffixes

وند

بسامد

کارکرد

(v) نمونه‌های تک‌بسامدی

P*(v/h)

بر حسب درصد

ی (مصدرساز)

40932

اسم‌ساز

603

0/26002587

26/0025873

ه

60289

اسم‌ساز/ صفت‌ساز/ قیدساز

348

0/15006468

15/0064683

انه

20513

قیدساز

285

0/1228978

12/2897801

ن

43539

اسم‌ساز

225

0/09702458

9/70245796

نده

12511

صفت‌ساز

126

0/05433376

5/43337646

گر

16471

صفت‌ساز

111

0/04786546

4/78654592

زاد

2521

صفت‌ساز

98

0/04225959

4/22595947

ی (نسبت)

10705

اسم‌ساز

90

0/03880983

3/88098318

گرا

805

صفت‌ساز

83

0/03579129

3/57912893

مند

15032

اسم‌ساز

39

0/01681759

1/68175938

باز

707

صفت‌ساز

25

0/01078051

1/07805088

زده

432

صفت‌ساز

23

0/00991807

0/99180681

خانه

3605

اسم‌ساز

22

0/00948685

0/94868478

وار

2641

صفت‌ساز

21

0/00905563

0/90556274

خوار

118

صفت‌ساز

19

0/00819319

0/81931867

گاه

33119

اسم‌ساز

17

0/00733075

0/7330746

یه

16983

اسم‌ساز

17

0/00733075

0/7330746

گونه

1227

قیدساز

12

0/00517464

0/51746442

ستان (مکان)

14932

اسم‌ساز

12

0/00517464

0/51746442

بند

612

صفت‌ساز

10

0/0043122

0/43122035

چی

224

اسم‌ساز

10

0/0043122

0/43122035

سَرا

1174

صفت‌ساز

10

0/0043122

0/43122035

اد

2238

صفت‌ساز

9

0/00388098

0/38809832

شاه

71

اسم‌ساز

9

0/00388098

0/38809832

اً (تنوین به روی الف)

2590

قید‌ساز

8

0/00344976

0/34497628

بان

2156

صفت‌ساز

7

0/00301854

0/30185425

ور

500

صفت‌ساز

6

0/00258732

0/25873221

ار

5442

صفت‌ساز

5

0/0021561

0/21561018

ک

679

اسم‌ساز

5

0/0021561

0/21561018

گون

67

صفت‌ساز

5

0/0021561

0/21561018

ینه

657

اسم‌ساز

5

0/0021561

0/21561018

زار

194

صفت‌ساز

4

0/00172488

0/17248814

کده

1136

صفت‌ساز

4

0/00172488

0/17248814

ناک

1491

صفت‌ساز

4

0/00172488

0/17248814

آگین

158

صفت‌ساز

3

0/00129366

0/12936611

بخت

1900

صفت‌ساز

3

0/00129366

0/12936611

پناه

134

صفت‌ساز

3

0/00129366

0/12936611

چه

941

اسم‌ساز

3

0/00129366

0/12936611

یار

620

اسم‌ساز

3

0/00129366

0/12936611

ا (ندا)

53

صفت‌ساز

2

0/00086244

0/08624407

آسا

28

صفت‌ساز

2

0/00086244

0/08624407

باره

2417

قیدساز

2

0/00086244

0/08624407

پیشه

30

صفت‌ساز

2

0/00086244

0/08624407

تا

28

اسم‌ساز

2

0/00086244

0/08624407

دان

16

صفت‌ساز

2

0/00086244

0/08624407

دیس

174

اسم‌ساز

2

0/00086244

0/08624407

سان

326

اسم‌ساز

2

0/00086244

0/08624407

فشان

208

صفت‌ساز

2

0/00086244

0/08624407

اکی

29

صفت‌ساز

1

0/00043122

0/04312204

بد

167

اسم‌ساز

1

0/00043122

0/04312204

سار

34

صفت‌ساز

1

0/00043122

0/04312204

سیر

135

اسم‌ساز

1

0/00043122

0/04312204

فام

22

اسم‌ساز

1

0/00043122

0/04312204

فروز

1

صفت‌ساز

1

0/00043122

0/04312204

گار

1153

اسم‌ساز

1

0/00043122

0/04312204

گسار

1

اسم‌ساز

1

0/00043122

0/04312204

لاخ

1

اسم‌ساز

1

0/00043122

0/04312204

ا

519

قیدساز

0

0

0

اُم

54

اسم‌ساز

0

0

0

اُمین

3894

اسم‌ساز

0

0

0

ا (افسوس)

10

اسم‌ساز / صفت‌ساز

0

0

0

اک

329

اسم‌ساز

0

0

0

بس

586

اسم‌ساز

0

0

0

سا

46

صفت‌ساز

0

0

0

سر

4180

صفت‌ساز

0

0

0

ش (مصدرساز)

1017

اسم‌ساز

0

0

0

لا

2

صفت‌ساز

0

0

0

نا

43

صفت‌ساز

0

0

0

واره

2295

اسم‌ساز

0

0

0

وش

21

اسم‌ساز

0

0

0

وا

36

اسم‌ساز

0

0

0

واره

2295

اسم‌ساز

0

0

0

 

همان‌طور که روشن است از میان پسوندها، پسوند «ی (مصدرساز)» زایاترین و پسوندهایی که تعداد نمونه‌هایی تک‌بسامدی آن‌ها برابر با صفر است، غیرزایاترین‌ها هستند؛ مانند وندهای: «سر»، «ش (مصدرساز)»، «لا»، «نا»، «نشان»، «وا»، «واره» و «وش». همان‌گونه که دربارۀ پیشوندها توضیح داده شد؛ دربارۀ پسوندها نیز می‌توان گفت از پسوندهایی که نمونه‌های تک‌بسامدی آن‌ها برابر با صفر است، در ساخت واژه‌های جدید استفاده نمی‌شوند. همچنین، بسامد کلی واژه‌های نمونه ساخته‌شده با این پسوندها نشان می‌دهد واژه‌هایی که پیش‌تر از ترکیب با این وندها ساخته شده‌اند، هنوز کاربرد دارند. مقایسه نتیجه پژوهش حاضر با دیگر پژوهش‌ها چنین است:

در پژوهش محمدی (1390)، پیشوند «هم» و از میان پسوندها، وندهای «ش»، «ی/ نسبت» و «گاه» را زایاترین دانسته‌اند. در پژوهش حاضر، در پیوستار زایایی، پیشوند «هم» در مرتبة زایاترین قرار ندارد. همچنین، از میان پسوندها نیز وندهای «ش»، «ی/ نسبت» و «گاه» در پیوستار زایایی جایگاه درخور توجهی ندارند. بنابراین، نتایج پژوهش حاضر با پژوهش مذکور همسو نیست. در پژوهش شریفی و عرفانیان قونسولی (1390)، وندهای «ی/ نسبت»، «ی، مصدری» و «ه» بیشترین زایایی و وندهای «مان»، «در»، «سان»، «با»، «واده»، «فرا»، «وا»، «ال» و «وند» کمترین زایایی را داشته‌اند. در پژوهش حاضر نیز پسوندهای «ی (مصدرساز)»، «ه» و «ی (نسبت)» در مرتبة زایاترین پسوندها قرار دارند و نتایج پژوهش حاضر از این نظر با پژوهش مذکور همسو است. دربارۀ پسوندهای «مان»، «در»، «سان»، «با»، «واده»، «فرا»، «وا»، «ال» و «وند» باید گفت که این پسوندها در پیوستار زایایی این پژوهش، در جایگاه غیرزایاترین‌ها قرار ندارند. بنابراین، نتایج پژوهش حاضر از این نظر با پژوهش مذکور همسو نیست. در پژوهش عابدینی و همکاران (1398)، پیشوند «غیر» با بیشترین زایایی مشخص شده است. در پژوهش حاضر پیشوند «غیر» در مرتبة زایاترین قرار ندارد. بنابراین، پژوهش حاضر در نتیجه‌گیری از زایایی پیشوند «غیر»، با پژوهش مذکور همسو نیست. در پژوهش فراگردی (1389)، پیشوند «سر» زایا و پیشوندهای «غیر» و «بر» نیمه‌زایا هستند. در پژوهش حاضر پیشوند «سر» در مرتبة زایاترین قرار ندارد بلکه می‌توان گفت مانند دو پسوند «غیر» و «بر» در مرتبة نسبتاً ‌زایا قرار دارد. بنابراین نتایج پژوهش حاضر با پژوهش مذکور چندان همسو نیست.

بنابر نظر بائر (2004) هرچه میزان زایایی بیشتر باشد، معنای واژه قابل‌پیش‌بینی‌تر است. در صورت‌هایی که زایایی بیشتری دارند، می‌توان معنای واژه را از تک‌تک اجزای تشکیل‌دهنده تشخیص داد. «بی/ منفی‌ساز، به معنای نبود چیزی»، «نا/ منفی‌ساز، به معنای نبود چیزی» و «پُر/ به معنای کثرت»، زایاترین پیشوندها هستند. با بررسی نمونه‌های زیر که از پیکره استخراج شده‌اند، می‌توان سخن بائر را بررسی کرد: واژه‌های مرتبط با پیشوند «بی»: بیکار (بی+کار/ به معنای کسی که کار ندارد)، بی‌توجه (بی+توجه/ به معنای کسی که توجه ندارد) و بی‌نظیر (بی+نظیر/ به معنای بدون مانند). واژه‌های مرتبط با پیشوند «نا»: نادیده (نا+دیده/ به معنای چیزی که دیده نشده)، ناشنوا (نا+شنوا/ به معنای کسی که نمی‌شنود.) و ناخالص (نا+خالص/ به معنای خالص نبودن). از بررسی مثال‌های بالا با وندهای زایا می‌توان دریافت که درک معنای واژه‌های مذکور از اجزای تشکیل‌دهندة آن‌ها، ممکن و قابل‌پیش‌بینی است. درخصوص وندهای غیرزایا نیز می‌توان گفت: نمونه‌های تک‌بسامدی پیشوندهای «پیرا/ به معنای پیرامون چیزی» و «ور/ به معنای بَر، بیرون، فرا، بالا یا تأکید» برابر با صفر است و در جایگاه وندهای غیرزایا قرار دارند. از واژه‌های مرتبط با پیشوند «پیرا»، می‌توان پیراپزشکی (پیرا+پزشکی) را نام برد. در این واژه نمی‌توان به‌طور دقیق گفت پیراپزشکی به رشته‌های اطراف پزشکی اطلاق می‌شود. واژة اطراف در اینجا مبهم است. می‌توان گفت پیراپزشکی به رشته‌هایی اطلاق می‌شود که وابسته به رشتۀ پزشکی هستند یا در واقع مربوط به حوزة پزشکی هستند. همچنین مثالی برای پیشوند «ور»، واژة ورشکسته (ور+شکست+ه) به معنای شخص مال‌باخته است. در این واژه، معنای کلی واژه هیچ ارتباطی با تک‌تک اجزای سازندة آن ندارد. بنابراین درباره‌ی زایایی پیشوندها و قابل پیش‌بینی بودن معنای این واژه‌ها، نظر بائر مورد تایید قرار می‌گیرد.

تحلیل دیدگاه بائر (2004) را با توجه به میزان زایایی پسوندها نیز می‌توان بررسی کرد. از زایاترین پسوندها می‌توان به این موارد اشاره کرد: «ی (مصدرساز)»، «ه/ صفت فاعلی، صفت مفعولی و اسم‌ساز»، «انه/ نشان‌دهندة شباهت، نسبت و لیاقت»، «ن (مصدرساز)»، «ساز/ به معنای سازندگی»، «دار/ به معنای دارندگی»، «نده/ گاهی در معنای فاعلی» و «گر/ نشان‌دهندة شغل یا انجام دهندة کاری». برخی از واژه‌های مرتبط با پسوند «گر» عبارت‌اند از: تماشاگر (تماشا+گر/ کسی که تماشا می‌کند)، شناگر (شنا+گر/ کسی که شنا می‌کند)، کارگر (کار+گر/ به‌طور کلی یعنی کسی که کار می‌کند). برخی از واژه‌های مرتبط با پسوند «نده» عبارت‌اند از: نویسنده (نویس+نده/ کسی که می‌نویسد(فاعل))، راننده (ران+نده/ کسی که می‌راند (فاعل)) ضدعفونی‌کننده (ضد+عفونی+کن+نده/ چیزی که ضدعفونی می‌کند). در این موارد، معنی قابل پیش‌بینی است. واژه‌های مرتبط با پسوند «ساز»، ازجمله خودروساز (خودرو+ساز/ کسی که خودرو می‌سازد)، آینده‌ساز (آینده+ساز/ کسی یا چیزی که آینده را می‌سازد)، حاشیه‌ساز (حاشیه+ساز/ کسی که حاشیه می‌سازد)، نیز معنایی قابل پیش‌بینی دارند. دربارۀ واژه‌های مرتبط با پسوند «دار» ازجمله مردم‌دار (مردم+دار کسی که با مردم خوب رفتار می‌کند)، باردار (بار+دار به کسی که بار دارد اما معمولاً به شخص آبستن می‌گویند نه هر کسی که باری دارد)، ادامه‌دار (ادامه+دار/ چیزی که ادامه دارد) معنای واژه‌ها چندان قابل پیش‌بینی نیست.

از غیرزایاترین پسوندها نیز می‌توان به این موارد اشاره کرد: «سر/ نشان‌دهندۀ زمان، مکان و اسم»، «ش (مصدرساز)»، «لا/ شبه‌پسوند صفت ساز»، «نا/ پسوند اسم‌ساز و گاهی به معنای مکان»، «نشان/ وندواره به معنای نشانه»، «وا/ به معنای حفاظت و نگهبانی و نشان‌دهندة شغل»، «واره/ به معنای شباهت، دارندگی و لیاقت» و «وش/ به معنای شباهت». شایان ذکر است که برای برخی وندها نمی‌توان معنای خاصی تعریف کرد. مانند وند «ش (مصدرساز)». با توجه به نمونه‌های زیر می‌توان دریافت که نظر بائر دربارة ارتباط زایایی با پیش‌بینی‌پذیر بودن چگونه است: برخی از واژه‌های مرتبط با پسوند «نا»: تنگنا (تنگ+نا/ به معنای سختی)، مرتبط با پسوند «واره»: یادواره (یاد+واره/ مراسمی که برای تجلیل از شخصی برگزار می‌کنند)، جشنواره (جشن+واره/ مراسم همگانی)، الگوواره (الگو+واره)، گوشواره (گوش+واره/ آویز زینتی)، مرتبط با پسوند «وش»: مهوش (مه+وش/ مانند ماه)، پریوش (پری+وش/ مانند پری) و مرتبط با وند «وا»: نانوا (نان+وا/ کسی که نان می‌پزد)، پیشوا (پیش+وا/ پیشرو، سردسته).

 

5. نتیجه‌گیری

هدف پژوهش حاضر، بررسی میزان زایایی وندهای اشتقاقی زبان فارسی با استفاده از معیار باین (2009) بود. ابتدا وندها از منابع مختلف گردآوری شدند. سپس، با استفاده از پیکرة به‌روزشونده و با کمک یک دستور برنامه‌نویسی، وندها در پیکره جست‌وجو شدند. برای هر وند، تعدادی واژة نمونه جست‌وجو شد. در نتیجة بررسی واژه‌های نمونه و محاسبة میزان زایایی، زایایی پیشوندها و پسوندها اشتقاقی مشخص شد.

از میان پیشوندها «بی» زایاترین و غیرزایاترین «بل» و «پیرا» و «ور» هستند. از میان پسوندها نیز وند «ی (مصدرساز)» زایاترین و پسوند «سر» «وا»، «واره»، «وش» و دیگر وندهایی که زایایی آن‌ها برابر با صفر است غیرزایاترین‌ هستند.

در خصوص نظریه بائر (2004) دربارۀ ارتباط میان زایایی و قابل پیش‌بینی بودن معنا نیز باید گفت که اگرچه در اغلب موارد می‌توان این نظریة را تایید کرد، در مواردی نیز همچون واژهای ساخته‌شده با پسوند زایای «دار» و پسوند غیرزایای «وش» این نظریه زیر سؤال می‌رود. در نتیجه اگرچه نظریة بائر در بیشتر موارد درست به‌نظر می‌رسد؛ ولی موارد نقض آن نیز یافت می‌شود.

 

[1]. productivity

[2]. A. Laudanna and C. Burani

[3]. P. Kiparsky

[4]. Affixoid: morphological categories between stems and affixes, the so-called affixoids.

[5] . هم‌آوا و هم‌نویسه: دارای شکل نوشتاری و تلفظ یکسان ولی با معنای متفاوت.

[6]. A. Taylor and V. Evans

[7]. A. Renouf

[8]. COBUILD

[9]. G. Cannon

[10]. Merriam-Webster

[11]. O. Pustylnikov and K. Schneider-Wiejowski

[12]. R. Kreyer

[13]. W. Liu and H. Shen

[14].Corpus of Contemporary American English

[15]. A. Gatt and R. Fabri

[16]. Maltese

[17]. K. Denistia and R. H. Baayen

[18]. Leipzig Corpora

[19] . ویراویراست سامانه‌ای هوشمند است که برای زبان فارسی، به‌ویژه برای نگارش و ویرایش زبان فارسی، ساخته شده است. این سامانه بخش‌های مختلفی دارد که برای کسب اطلاعات بیشتر می‌توان به نشانی اینترنتی https://viravirast.com مراجعه کرد.

[20]. Crawl

یک موتور جست‌وجو است که مشخص می‌کند کدام صفحات از داده یا پیکره مدنظر باید جست‌وجو شوند. موتور جست‌وجوی گوگل از همین نوع است.

[21]. Natural Language Tool Kit for python.

[22]. Python library for digesting Persian text.

[23]. Antconc

[24]. Lancsbox

[25]. realized word

[26]. potential word

[27]. Hapax legomena

[28]. General productivity

ابراهیمی، قربانعلی. (1373). سیر تاریخی وندهای زبان فارسی و کارکرد آن در شاهنامه فردوسی. [پایان‌نامة کارشناسی ارشد]. دانشگاه شیراز.
افراشی، آزیتا و کوشکی، فاطمه. (1397). تحلیل معناشناسی پیش‌‌وند پیش- در زبان فارسی: رویکرد زبان‌ شناسی شناختی. زبان‌پژوهی، (25)9، 137-166.
انوری، حسن. (1381) فرهنگ سخن. سخن.
رحمانی، امین؛ لک‌زاده، فاطمه؛ باستانی، رضا و نواب‌صفوی، زهرا. (1399). ویراویراست. (دسترسی از https://viravirast.com )
سمیعی، احمد؛ صفوی، کوروش و یارمحمّدی، لطف‌اله. (1387) مبانی زبان‌شناسی، درس‌نامه دورۀ کاردانی و کارشناسی آموزش زبان و ادبیات فارسی. مدرسه.
شریفی، شهلا و عرفانیان قنسولی، لیلا. (1390). بررسی وندهای اشتقاقی زایا و غیرزایا در فارسی معاصر. به کوشش فریبا قطره و شهرام مدرس خیابانی، مجموعه‌مقالات سومین هم‌اندیشی صرف (128-123). انتشارات دانشگاه فردوسی مشهد.
شقاقی، ویدا. (1389). مبانی صرف. سمت.
طباطبایی، علاءالدین. (1395). فرهنگ توصیفی دستور زبان فارسی. فرهنگ معاصر.
عابدینی، حمیرا؛ مولودی، امیرسعید و خرمایی، علیرضا. (۱۳98). بررسی پیکره‌بنیاد زایایی پیشوندهای اشتقاقی در گونه نوشتاری زبان فارسی معاصر. زبان‌شناسی گویش‌های ایرانی، (2)4، ۲۴۳-۲۶۵.
عباسی، آزیتا. (۱۳۸۵). محدودیت‌های صرفی و نحوی در زایایی فرایند اشتقاق در زبان فارسی. زبان و زبان‌شناسی، (4)2، 39-58.
فراگردی، راحله. (1389). پیشوندهای زبان فارسی. [پایان‌نامة کارشناسی ارشد]. دانشگاه علامه طباطبایی.
فرشیدورد، خسرو. (1392). فرهنگ پیشوندها و پسوندهای زبان فارسی. زوار.
کشانی، خسرو. (1371). اشتقاق پسوندی در زبان فارسی امروز. سمت.
کلباسی، ایران. (1387). ساخت اشتقاقی واژه در فارسی امروز. پژوهشگاه علوم انسانی و مطالعات فرهنگی.
محمدی، ژیلا. (1390). زایایی وندها. فصل‌نامة رشد آموزش زبان و ادب فارسی، 97، ۶۴-67.
معین، محمد.( 1386) . فرهنگ فارسی. بهزاد.
مولودی، امیرسعید و رضایی شریف‌آبادی، مرتضی. پیکرۀ به‌روزشوندۀ پارسی (دسترسی از  www.peikare.ir در تاریخ 18/05/ 1399)
ذهاب ناظوری، سمیرا؛ نجفیان، آرزو؛ زندی، بهمن؛ سبزواری، مهدی. (1398). پیشوندواره های زبان فارسی: تحلیل شناختی. پژوهش‌های زبانی، (2)10، ۸۳-۱۰۵.
Abbassi, Azita. (2007). Morphological and Syntactic Constraints of Productivity in Persian Derivation. Language and Linguistics, 2(4), 39-58. [In Persian]
Abedini, H., Moloodi. A., & Khormaee. A. (2019). A Corpus-based Study of Productivity of Derivational Prefixes in the Written Variety of Contemporary Persian. Journal of Iranian Language Linguistics, 4(2), 243-265. [in Persian]
Afrashi, A., Koushki. F. (2018). Semantic analysis of pish prefix in Persian Language: Cognitive linguistics approach. Language Research, 9(25), 137-166. [in Persian]
Al. B.P.F., & Booij. G. E. (1981). De Productiviteit Van Woordvormingsregels. Forum der Letteren, 22, 26-38.
Anvari, H. (2002). Sokhan Comprehensive Dictionary. Sokhan. [in Persian]
Aronoff, M. (1994). Morphology by itself. MIT Press.
Aronoff, M. (1976). Word formation in generative grammar. Linguistic Inquiry Monographs Cambridge. Cambridge University Press.
Baayen, H. (1991). Quantitative aspects of morphological productivity. In G. Booij (Ed.), Yearbook of Morphology (109-149). Kluwer.
Baayen, H. (1992). On frequency, transparency, and productivity. In G. Booij & J. van Marle (Eds.), Yearbook of Morphology (pp. 181-208). Springer.
Baayen, R. H. (1994). Derivational productivity and text typology. Journal of Quantitative Linguistics, 1, 16-34.
Baayen. R. H. (2009). Corpus linguistics in morphology: Morphological productivity. In A. Luedeling & M. Kyto (Eds.), Corpus Linguistics. An International Handbook (pp. 900-919). Mouton De Gruyter.
Baayen. R. H., & Renouf. A. (1996). Chronicling the times: Productive lexical innovations in an English newspaper. Language, 72, 69-96.
Bauer, L. (1988). Introducing linguistic morphology. Edinburg University Press.
Bauer, L. (1996). Is morphological productivity non-linguistic. Acta Linguistica Hungarica, 43, 19-31.
Bauer, L. (2004). Morphological productivity. Cambridge University Press.
Booij, G. E. (2007). The Grammar of Words: An Introduction to Linguistic morphology. Oxford University Press.
Cannon, G. (1988). Historical change and English word-formation. Peter Lang.
Denistia, K. and Baayen, R. H. (2019). The Indonesian prefixes PE- and PEN-: A study in productivity and allomorphy. Morphology, 29(3), 385-407.
Ebrahimi, G.A. (1994). A historical survey of Persian affixes and their usages in Ferdowsi’s Shahnameh [M.A. Thesis]. University of Shiraz. [In Persian]
Faragardi, R. (2010) Persian Prefixes [M.A. Thesis]. Allame Tabatabai University. [in Persian]
Farshidvard, K. (2013) The Dictionary of Persian Prefixes and Postfixes. Zavar. [in Persian]
Gatt, A. and Fabri, R. (2018). Borrowed affixes and morphological productivity: A case study of two Maltese nominalisations. The languages of Malta, 18, 143-153.
Kalbasi, I. (2008) The Derivational structure of word in modern Persian. Institute of Humanities and Cultural Studies. [in Persian]
Keshani, K. (1992) Prefix derivational in modern Persian. Samt. [in Persian]
Kiparsky, P. (1982) Word-formation and the lexicon. In F. Ingemann (Ed.), Proceedings of the 1982 Mid-America Lingistics Conference (pp. 1-20). Lawrence.
Kreyer, R. (2008). Corpora in the classroom and beyond. In F. Zhang (Ed.), Handbook of research on computer-enhanced language acquisition and learning (pp. 422-437). IGI Global.
Kuryłowicz, J. (1960). Esquisses linguistiques. Wrocław.
Laudanna, A. Burani, C. (1985). Address mechanism to decomposed lexical enteries. Linguistics, 23, 775-792.
Lieber, R. (1981). On the organization of the lexicon. [Unpublished PhD dissertation]. Massachusetts Institute of Technology.
Liu, W. and Shen, H. (2012). A corpus-based analysis of English suffix –esque. Theory and Practice in Language Studies, 2(4), 767-772.
Mohammadi, Z. (2011) Productivity of affixes. The Journal of Teaching Persian Language. 97, 64-67. [in Persian]
Moein, M. (2007). Persian Dictionary. Behzad. [in Persian]
Moloodi, A., & Rezaeisharifabadi. M. Monitor corpus (www.peikare.ir 7/9/2021). [In Persian]
Pustylnikov, O., & Schneider-Wiejowski, K. (2009). Measuring morphological productivity. Studies in Quantitative Linguistics, 5, 106-125.
Rahmani, A. and Lakzadeh, F. and Bastani. R. and Navabsafavi, Z. (2021) Viravirast (https://viravirast.com). [in Persian]
Samie, A. and Safavi. K. and Yarmohammadi. L. (2008). An Introduction to Linguistics. Madreseh. [in Persian]
Shaghaghi, V. (2010). An introduction to morphology. Samt. [in Persian]
Sharifi, Sh. and Erfanian-ghonsouli, L. (2011). The study of productive and non-productive derivational Persian affixes. In F. Ghatre & S. Modarress Khiyabani (Eds.), The Journal of Third Conference of Morphology (pp. 123-128). Ferdowsi University Press. [in Persian]
Tabatabei. A (2016). The dictionary of Persian grammar. Moaser. [in Persian]
Tayler, A. and Evans, V. (2003). The semantics of English prepositions: Spatial scenes, embodied meaning and cognition. Cambridge University Press.
Zahab-Nazoory, S. and Najafian, A. and Zandi, B. and Sabzevari, M. (2020). Persian prefixoids: A cognitive analysis, Language Research, 10(2), 83-105. [in Persian]