The Role of Acoustic Parameters in Distinguishing Persian Simple Past and Present Perfect Tenses

Document Type : Research Paper

Authors

1 Associate Professor, Department of English and Linguistics, Faculty of Literature and Human Sciences Imam Khomeini International University, Qazvin, Iran

2 MA in Linguistics, Department of English Language and Linguistics, Faculty of Literature and Human Sciences Imam Khomeini International University, Qazvin, Iran

Abstract

Abstract
This paper addressed the acoustic factors involved in distinguishing simple past and present perfect tenses in Persian. The pronunciation of Persian simple past and present perfect tenses in colloquial speech are the same segmentally but different in terms of the position of stress. In an experimental study, the pattern of distribution of some important prosodic parameters, including F0, intensity, and duration, was investigated in a speech corpus consisting of 24 sentences. Results suggested that none of the study parameters could differentiate simple past and present perfect tenses reliably and consistently. After normalizing F0 and computing the average pitch for all acoustic data per speaker, it was found that it is the value of F0 peaks and valleys in the target syllables that makes a fundamental distinction between simple past and present perfect. Results of statistical tests confirmed this finding, suggesting that the local F0 value is a reliable and consistent parameter that distinguishes simple past from present perfect in both the syntagmatic and paradigmatic axes.
Keywords: Simple past, Present perfect, Local F0, Duration, Intensity
 
Introduction
This paper addressed the acoustic factors involved in distinguishing simple past and present perfect tenses in Persian. The pronunciation of Persian simple past and present perfect tenses in colloquial speech are the same segmentally but different in terms of the position of stress.
Stress is a linguistic property of a word, specifying which syllable is stronger in the word compared to any others. Early studies, such as Fry (1955, 1958), Lieberman (1960), Beckman (1986), Harrington, Beckman, and Palethorpe (1998) (see also Laver, 1994 for an overview) have shown that there are clear acoustic differences between stressed and unstressed syllables: stressed syllables are realized with a higher pitch, higher intensity, longer duration, and more peripheral vowel quality than unstressed syllables. Studies in many stress accent languages show that the realization of a stressed syllable differs from the unstressed syllable due to having a higher pitch. Also, results have shown that speakers consistently used duration to distinguish between open and central vowels having contrastive stress at the word level, while contrastive stress between open vowels at the phrase level was mainly accompanied by the intonational prominence contrast. Compared to F0 and duration, the relation of intensity variation needs to be discussed further in the speech signal to word stress.
On the one hand, previous work has generally emphasized that intensity manipulations prove much weaker cues than duration in perceived stress (Fry, 1955, 1958; Turk & Sawusch, 1996, for English; Mol & Uhlenbeck, 1956, for Dutch). Furthermore, several different operationalizations of intensity, such as intensity summed over time (Beckman, 1986) and spectral tilt (i.e., the degree to which intensity changes as frequency increases) (Sluijter & van Heuven, 1996a; Sluijter, van Heuven, & Pacilly, 1997), have been shown to be consistent correlates of stress. For example, Sluijter and van Heuven (1996) argue that previous study has demonstrated that, on the one hand, loudness variation virtually inconsequential for perceived stress is typically based on analyses that do not distinguish between word stress and, on the other hand, pitch accent-induced prominence. They note that if a more accurate measure of intensity is used, the traditional account of stress as a local increase in loudness seems justified.
 
Materials and Methods
In an experimental study, the pattern of distribution of some important prosodic parameters, such as F0, intensity, and duration, was investigated in a speech corpus consisting of 24 sentences. The target words in such sentences were simple past and present perfect tenses that would be produced with a flat pitch melody characterizing post-focal accent, and that the phrase-level accent was far away from the target word so that no effects of the accent would be observed there.
All acoustic measurements were taken using the speech software Praat (Boersma & Weenink, 2020). In each word, syllable and vowel boundaries were manually identified and annotated as the measurement intervals. Segmentation criteria were based on both waveform and spectrogram cues, as suggested by Peterson and Lehiste (1960). Measurements of all acoustic variables were made automatically using ProsodyPro (Xu, 2020).
 
Discussion of Results and Conclusions
Results suggested that none of the parameters selected could differentiate simple past and present perfect tenses reliably and consistently. After normalizing F0 and computing the average pitch for all acoustic data per speaker, it was found that it is the value of F0 peaks and valleys in the target syllables that makes a fundamental distinction between simple past and present perfect. Results of statistical tests confirmed this finding, suggesting that the local F0 value is a reliable and consistent parameter that distinguishes simple past from present perfect in both the syntagmatic and paradigmatic axes.

Keywords

Main Subjects


مقدمه

زبان فارسی، زبانی تکیه‌‌پایانی است که در آن، تکیه اغلب بر روی هجای پایانی کلمات قرار می‌‌گیرد ( Ferguson,1957). انواع مختلف کلمات فارسی از جمله اسم، صفت، قید، فعل و حرف اضافه از این الگوی توزیعی پیروی می‌‌کنند (سامعی، 1374). وندهای اشتقاقی و وندهای تصریفی هر دو تکیه‌‌بر هستند و تکیه کلمه را جذب می‌‌کنند. در مقابل، واژه‌‌بست‌‌ها برخلاف وندهای اشتقاقی و وندهای تصریفی، بدون تکیه هستند. از این رو، وقتی واژه‌‌بست‌‌ها به کلمه‌‌ای اضافه می‌‌شوند، جایگاه تکیۀ کلمه تغییر نمی‌‌کند. اسلامی (1388: 7) جایگاه تکیه در کلمات فارسی را تبیین کرده است. او در توضیح رفتار متفاوت واژه‌‌بست‌‌ها در مقایسه با وندهای اشتقاقی و تصریفی توضیح می‌‌دهد که واژه‌‌بست‌‌ها به‌لحاظ مفهومی بخشی از ستاک خود محسوب نمی‌‌شوند، بلکه اشاره به مفهومی جداگانه دارند. به همین دلیل، واژه‌‌بست‌‌ها عناصری هستند که به کلمه اضافه می‌‌شوند در حالی که بخشی از آن نیستند.

اسلامی (1388) در جای دیگری بیان می‌‌کند که در ساختمان فعل ماضی نقلی فارسی دو نوع تکواژ وجود دارد. وند اول یعنی تکواژ/-e/  نمایندۀ نمود کامل است و وندی تصریفی به‌‌شمار می‌‌آید؛ زیرا با اضافه شدن /-e/ به فعل واژگانی مقولة آن تغییر نمی‌‌کند و حاصل نیز فعل است. وند دوم نشانگر شناسه فعل است. از طرفی به ‌‌دلیل محدودیت توالی دو واکه در زبان فارسی، یک همزه پس از تکواژ نمود کامل در پایانة ستاک قرار می‌‌گیرد که تنها یک فرایند واجی است، نه صرفی و نحوی. در محاوره و گفتار سریع، معمولاً تکواژ نمود کامل در ماضی نقلی حذف و واکۀ شناسه کشیده‌‌تر از حالت معمولی تلفظ می‌‌شود. در این حالت، همزه یعنی همخوان میانجی بست چاکنایی، به دلیل رفع محدودیت توالی دو واکه فرصت ظهور نمی‌‌یابد.

نمونه‌‌ای از صورت واجی ماضی ساده (1)، صورت واجی ماضی نقلی (2)، قاعدۀ (واژ-واجی) حذف تکواژ نمود کامل (3) و روساخت آوایی ماضی نقلی (4) در زیر ارائه شده است:

 

(1) ˈbordand = bord + and                                                   بُردند = بن ماضی + شناسه فعل ماضی          

(2) borˈdeand = bord + e + and                  بُرده‌‌اند = بن فعل ماضی نقلی + تکواژ نمود کامل + شناسه فعلی

(3)    /e/                     ∅              [بن فعل ماضی]               [شناسه فعلی]

(4) borˈdand

 

پس از حذف تکواژ نمود کامل فعل، یعنی /e/ مطابق با قاعده (3)، صورت آوایی افعال ماضی نقلی فارسی در گفتار محاوره‌‌ای به‌لحاظ ساختِ زنجیری کاملاً شبیه به افعال ماضی ساده می‌‌شود. با وجودِ این، ساختِ نوایی افعال ماضی ساده و ماضی نقلی فارسی همچنان با یکدیگر متفاوت است. در ماضی ساده تکیه روی هجای پایانی بن فعل ماضی قرار می‌‌گیرد (1)؛ اما در ماضی نقلی تکیه روی تکواژ نمود کامل فعل، یعنی /e/، قرار می‌‌گیرد (2). در روساخت آوایی با وجودی که /e/ از زنجیرۀ آوایی گفتار حذف می‌‌شود، تکیۀ آن در ساخت نوایی فعل باقی می‌‌ماند و به هجای بعد از آن یعنی شناسۀ فعلی منتقل می‌‌شود. بنابراین، محل وقوع تکیه در روساخت آوایی ماضی ساده و ماضی نقلی با یکدیگر متفاوت است.

انگیزۀ اصلی انجام این پژوهش بررسی و شناسایی سرنخ‌‌های صوتی مؤثر در ایجاد تمایز آوایی بین افعال ماضی ساده و ماضی نقلی فارسی است. دیرش هجا، فرکانس پایه و شدت انرژی همبسته‌‌های محتمل نوای گفتارند که می‌‌توانند به تنهایی و یا در ترکیب با یکدیگر صورت آوایی افعال ماضی ساده و ماضی نقلی را از یکدیگر متمایز کنند. بنابراین، تعیین اینکه هریک از این پارامترها تا چه اندازه قادرند بین افعال هدف پژوهش تمایز صوتی ایجاد کنند، اهمیت زیادی دارد. از سوی دیگر، الگوی تغییرات فرکانس پایه به‌صورت متوسط F0، دامنۀ F0 و بیشینۀ F0 اندازه‌‌گیری می‌‌شود که همگی آنها الزاماً به‌طور همزمان در سطح پیاده‌‌سازی آوایی برای تمایز صورت آوایی جفت‌‌واژه‌‌های تکیه‌‌ای محقق نمی‌‌شوند و از این رو باید دید که در صورت تمایز آوایی افعال ماضی ساده و ماضی نقلی فارسی برحسب فرکانس پایه، کدام‌یک از پارامترهای مبتنی بر تغییرات F0 در این زمینه تأثیرگذارند. بر این اساس، در مطالعه‌ای آزمایشگاهی تغییرات پارامترهای صوتی مهمِ نوای گفتار مانند دیرش، شدت انرژی و فرکانس پایه را در صورت آوایی افعال ماضی ساده و نقلی اندازه‌‌گیری و در رابطه با میزان اعتبار هریک از این پارامترها در ایجاد تمایز صوتی بین افعال مدنظر بحث خواهیم کرد.

 

تکیه از دیدگاه آوایی

تکیه واژگانی و تکیة زیروبمی دو ویژگی‌‌ زبرزنجیری مهم در تولید و درک گفتار هستند. که در دو سطح مستقل زبانی مطالعه می‌‌شوند. در سطح کلمه، تکیه متغییری ساختاری است که برجستگی آوایی یک واحد زبانی (هجا) را در مقایسه با سایر هجاها مشخص می‌‌کند و محل پذیرش تغییرات زیروبمی در منحنی آهنگ گفتار است. در مقابل، تکیة زیروبمی به برجستگی‌‌هایی گفته می‌‌شود که گوینده در سطوح بالاتر از کلمه، یعنی پاره‌‌گفتار، با استفاده از تغییر سطح فرکانس پایه و الگوی زیروبمی بر روی هجای تکیه‌‌بر ایجاد می‌‌کند و از این طریق آن کلمه را از سایر کلمات در جمله برجسته‌‌تر می‌‌سازد. بر این اساس، هجای تکیه‌‌بر برجستگی شنیداری بیشتری نسبت به هجاهای دیگر در فرایند درک گفتار پیوسته دارد و هجاهای دیگر نسبت به هجای اصلی میزان برجستگی پایین‌‌تری دارند یا فاقد برجستگی هستند (Hyman, 2014).

بنابراین، تکیة واژگانی وابسته به نظام زبانی و پیش‌‌بینی‌پذیر است؛ ولی تکیة زیروبمی مربوط به کنش زبانی و پیش‌‌بینی‌‌ناپذیر است (Sluijter & van Heuven, 1996 a, 1996 b).

آواشناسان دیرش، زیروبمی، کیفیت واکه و بلندای صدا را از مهم‌‌ترین هم‌‌بسته‌‌های آکوستیکی تکیة واژگانی به ‌‌شمار می‌‌آورند (Beckman, 1986; Lehiste, 1970; Fry, 1955). آزمایش‌‌ تولیدی فرای[1] (1955) نشان داد عامل اصلی تمایز تولیدی بین جفت‌‌واژه‌‌های اسمی/ فعلیِ زبان انگلیسی، مانند permit «اجازه دادن» و permit «اجازه؛ پروانه»، اختلاف سطح فرکانس پایه بین هجای تکیه‌‌بر و بدون تکیه است و اختلاف شدت انرژی و دیرش واکه‌‌های هجاهای تکیه‌‌بر و بدون تکیه در جفت‌‌واژه‌‌ها به‌طور نظام‌‌مند در تمامی داده‌‌ها با یکدیگر معنی‌‌دار نیست. بر همین اساس، فرای (1955) چنین نتیجه‌‌گیری کرد که F0 قوی‌‌ترین نشانۀ تولیدی- صوتی تکیۀ واژگانی است و عوامل دیگر، مانند دیرش، شدت انرژی و کیفیت واکه در تحقق آوایی تکیه اثر کمتری دارند. همچنین، او این‌گونه بحث کرد که نقش تکیۀ واژگانی این است که جایگاه‌‌های بالقوه برجستگی نوایی را بر روی منحنی زیروبمی گفتار مشخص کند. مطالعات انجام‌شده بر روی دیگر زبان‌‌ها از جمله انگلیسی (Beckman & Edwards, 1994)، اسپانیایی (Gili Gaya, 1975) و کاتالان (Recasens,1986) یافته‌‌های فرای (1955) را تأیید کرد. برای مثال، یافته‌‌های بِکمن و ادواردز[2] (1994) نشان داد آنچه اساساً باعث تقابل تکیۀ واژگانی در سطح کلمه می‌‌شود، تکیة زیروبمی است و اثر عوامل دیگر، مانند دیرش هجا و شدت انرژی تا حد زیادی وابسته به واکه و گویشور است. همچنین، آنها به این نتیجه رسیدند که کیفیت واکه (الگوی فرکانس سازه‌‌ها) بر خلاف دو عامل شدت انرژی و دیرش هجا، نشانۀ تولیدی- صوتی تکیة واژگانی است. بر این اساس، آنها چهار سطح کیفیِ مختلف برای تکیۀ واژگانی در زبان انگلیسی در نظر گرفتند. این سطوح به ترتیب از قوی‌‌ترین تا ضعیف‌‌ترین تکیه به‌ این صورت است: (1) هجا با واکۀ کامل و تکیة زیروبمیِ اصلی؛ (2) هجا با واکۀ کامل و تکیة زیروبمیِ غیراصلی؛ (3) هجا با واکۀ کامل بدون تکیة زیروبمی و (4) هجا با واکۀ ضعیف بدون تکیة زیروبمی. مجموع این یافته‌‌ها نشان داد تکیة واژگانی در سطح کلمه هیچ هم‌‌بستۀ تولیدی- درکی مشخصی ندارد و صرفاً یک ویژگی ساختاری برای نشاندار کردنِ الگوهای توزیعی در سطوح بالاترِ ساخت نوایی گفتار است که محتوای آوایی خود را نیز از این سطوح وام می‌‌گیرد. اسلویتر و فن‌‌هافن[3] (1996) در یک آزمایشِ تولیدی، دیرش و اختلاف شدت انرژیِ هجاهای تکیه‌‌بر و بدون تکیهِ جفت‌‌واژه‌‌های زبان هلندی را در دو بافت نوایی یکی دارای تکیة زیروبمی و دیگری فاقد زیروبمی با یکدیگر مقایسه کردند. اختلاف سطوح شدت انرژی در دو ناحیه فرکانسیِ جداگانه، یکی فرکانس‌‌های بالای 500 هرتز و دیگری تمامی نواحیِ فرکانسی، از جمله فرکانس‌‌های زیر 500 هرتز، اندازه‌‌گیری شد. نتایج نشان داد دیرش هجاها در هر دو بافت نوایی به‌‌‌طور معنی‌‌داری با یکدیگر متفاوت است. سطح شدت انرژی فرکانس‌‌های بالای 500 هرتز برای هجاهای تکیه‌‌بر در هر دو بافت نوایی به‌‌‌طور معنی‌‌داری از هجاهای بدون تکیه بیشتر است؛ ولی همین اختلاف برای تمامی نواحی فرکانسی، معنی‌‌دار نیست. آنها نتیجه‌‌گیری کردند که سطح شدت انرژی در فرکانس‌‌های بالای 500 هرتز (و نه تمامی فرکانس‌‌ها) عامل اصلی تمایز صوتی بین هجاهای تکیه‌‌بر و بدون‌‌ تکیه در هر دو بافت نوایی دارای تکیة زیروبمی و فاقد تکیۀ زیروبمی است و از این رو، شدت انرژی فرکانس‌‌های بالای 500 هرتز که به آن انحنای طیفی گفته می‌‌شود، هم‌‌بستۀ تولیدی-صوتی تکیۀ واژگانی است. مطالعات آزمایشگاهی این یافتۀ صوتی اسلویتر و فن‌‌هافن (1996) را به چالش کشید. برای مثال، کمپل و بِکمن[4] (1997) با آزمایش‏های صوتی که روی جفت‌‌واژه‌‌های زبان انگلیسی در بافتِ فاقد تکیه زیروبمی انجام دادند و به این نتیجه رسیدند که بین هجاهای تکیه‌‌بر و بدون‌‌ تکیه، اختلاف معنی‌‌داری از نظر سطوح شدت انرژیِ فرکانس‌‌های میانی و بالا وجود ندارد. همین‌‌طور اُرتگا-یباریا و پریتو[5] (2010) الگوی تولیدی-صوتی تکیة واژگانی را در دو زبان اسپانیایی کاتالان[6] و کاستیلیان[7] بررسی و ثابت کردند توزیع شدت انرژی در فرکانس‌‌های میانی و بالا برای واکه‌‌های تکیه‌‌بر و بدون تکیه اختلاف معنی‌‌داری را نشان نمی‌‌دهد. بنابراین، نتایج این مطالعات در حقیقت، با رد فرضِ اسلویتر و فن‌‌هافن (1996) نشان داد انحنای طیف در فرکانس‌‌های میانی و بالا بیش از هر چیز ناشی از تغییر ساختار فرکانسی سازه‌‌ها (کیفیت واکه) در اثر جابه‌جایی تکیۀ واژگانی در سطح کلمه است و ارتباط مستقیم با تکیۀ واژگانی ندارد.        

بر طبق بررسی‌‌های رده‌‌شناختی الگوی برجستگی نوایی کلمات، زبان‌‌ها به دو دسته تقسیم می‌‌شوند: (1) زبان‌‌هایی که هجای تکیه‌‌بر در آن‌‌ها نتیجۀ تحقق آوایی هم‌‌زمان نشانه‌‌های آکوستیکی چندگانه مثل فرکانس پایه، دیرش، شدت انرژی و تغییرات طیفی است و فرکانس پایه تنها پارامتر آکوستیکی شناسایی هجای تکیه‌‌بر نیست. این زبان‌‌ها، زبان‌‌های تکیه‌‌ای یا تکیه‌‌ای-آهنگی نامیده می‌‌شوند که هم‌زمان برجستگی واژگانی (تکیۀ واژگانی) و پساواژگانی (آهنگ) دارند (Beckman, 1986; Hyman, 2006, 2009, 2014). در این زبان‌‌ها، محل وقوع تکیة اصلی تا حد زیادی قابل پیش‌‌بینی است و تکیة واژگانی محتوایی آوایی دارد (صادقی، 1397). این الگوی برجستگی برای زبان‌‌های انگلیسی (Beckman, 1986)، هلندی (van Heuven & de Jonge, 2010)، اسپانیایی (Ortega-Llebaria & Prieto, 2010)، کاتالان (Ortega-Llebaria,Vanrell, & Prieto,2010) و فارسی (Sadeghi, 2017) به‌‌دست آمده است. (2) زبان‌‌های دستۀ دوم، زبان‌‌های غیرتکیه‌‌ای یا غیر تکیه‌‌ای-آهنگی هستند که در آنها برجستگی نوایی کلمات ناشی از تغییرات زیروبمی در سطح آهنگِ گفتار است. در این دسته از زبان‌‌ها، تکیة واژگانی محتوای آوایی ندارد و تنها یک ویژگی ساختاری ‌‌است که محل وقوع برجستگی پساواژگانی در سطح آهنگ گفتار را مشخص می‌‌سازد. بر این اساس، در زبان‌‌های دستۀ دوم، تمایز بین هجای تکیه‌‌بر و بدون تکیه در سطح آوایی فقط در حضور تکیة زیروبمی نمایان می‌‌شود (Hyman, 2014). نمونه‌‌ای از این زبان‌‌ها شامل زبان‌‌های ترکی (Levi, 2005)، مجاری (Hyman, 2014) و ژاپنی (Pierrehumbert & Beckman, 1988) است.[8]

فَندِرهالست[9] (2012) برای تکیة زیروبمی دو ماهیت آوایی و دیرشی در نظر می‌‌گیرد که ماهیت آوایی آن از طریق منحنی فرکانس پایه، یعنی تغییرات زیروبمی، و ماهیت دیرشی آن از طریق هجایی که تکیة زیروبمی را دریافت می‌‌کند، مشخص می‌‌شود. برای مثال، اگر در یک کلمه‌‌ هجایی حاوی تکیۀ واژگانی باشد و تکیة زیروبمی هم روی آن قرار گرفته باشد، به همان نسبت دیرش بیشتری هم نسبت به هجاهای معمولی دارد و هم از شدت انرژی بیشتری نیز برخوردار است. گوسِن‌‌هافِن[10] (2004) ادعا می‌‌کند تفاوت‌‌های زیروبمی به تفاوت‌‌های بین هجاهای حاوی تکیة زیروبمی و هجاهای بدون تکیۀ زیروبمی مربوط می‌‌شود، نه تکیة واژگانی.

تکیۀ واژگانی در زبان فارسی از دیدگاه آوایی بررسی شده که نتایج متناقضی به دست داده است. نتایج برخی مطالعات آزمایشگاهی نشان داده است که فرکانس پایه تنها همبستۀ آکوستیکی معتبر تکیه در زبان فارسی است و از این رو، زبان فارسی یک نظام غیرتکیه‌‌ای است که در آن برجستگی یک هجا در سطح واژه، حاصل اِعمال الگوی تغییرات زیروبمی به‌مثابه یک فرایند فراواژگانی است (Abolhasanizadeh, Bijankhan & Gussenhoven, 2012). رحمانی، ریتولد و گوسن‌‌هافن[11] (2015) با تأیید این یافتۀ صوتی نشان داده‌‌اند که میزان حساسیت شنیداری شنونده‌‌های فارسی‌‌زبان به تقابل‌‌های تکیه‌‌ای بسیار کم است؛ یعنی شنونده‌‌های فارسی به تغییرات آکوستیکی ناشی از جابه‌جایی محل وقوع برجستگی نوایی حساسیت کمی دارند. در مقابل، صادقی (2017) با مطالعۀ صوتی تکیۀ فارسی در یک تحقیق آزمایشگاهی جامع نشان داده است که زبان فارسی یک زبان تکیه‌‌ای-آهنگی است که در آن هجاهای تکیه‌‌بر و بدون تکیه در بافت‌‌ آهنگی (در بافت دارای تکیۀ زیروبمی) با استفاده از مجموعه‌‌ای از نشانه‌‌های آکوستیکی مانند فرکانس پایه (F0)، شدت انرژی و دیرش و در بافت غیرآهنگی (بافت فاقد تکیۀ زیروبمی) با استفاده از دیرش از یکدیگر متمایز می‌‌شوند. این یافته صادقی همسو با یافتة جون[12] (2005) است که زبان فارسی را با زبان‌‌های انگلیسی، آلمانی، هلندی، یونانی، ایتالیایی، اسپانیایی، عربی لبنانی و باینین گوک[13] (زبان شمال استرالیا) در طبقة زبان‌‌های تکیه‌‌ای-آهنگی قرار می‌‌دهد.

 

روش پژوهش

برای پاسخ به پرسش پژوهش از روش واج‌‌شناسی آزمایشگاهی استفاده کردیم. برای این منظور، پیکره‌‌ای شامل 24 جمله (2 الگوی زمانی × 12جفت‌جمله) طراحی شد. کلمات هدف (افعال ماضی ساده و ماضی نقلی) در این جملات دو هجایی و سه ‌‌هجایی بودند که زنجیرۀ واجی آنها از همخوان‌‌های رسا یا همخوان‌‌های گرفتۀ واکدار تشکیل شده بود. تمامی جملات طوری طراحی شدند که کلمات هدف (افعال ماضی ساده و ماضی نقلی) در جایگاه تکیة زیروبمی هسته[14] قرار بگیرند.

جملات بر روی کاغذ به آزمودنی‌‌ها ارائه و از آنها خواسته شد هر جمله را به‌‌‌صورت طبیعی، گفتار عادیِ روزمره، و با سرعت معمولی بخوانند. برای جلوگیری از جلب توجه احتمالی آزمودنی‌‌ها هیچ‌‌گونه برجستگی بر روی کلمات هدف در جملات ایجاد نشد. نمونه‌‌هایی از جملات در (5) و (6) ارائه و زیر کلمات هدف در این جملات خط کشیده شده است.

جملات را 39 شرکت‌‌کننده (21 زن و 18 مرد)، با محدودۀ سنی 30-19سال، با تحصیلات دانشگاهی و با گویش فارسی معیار به‌صورت داوطلبانه تولید کردند. به‌طور کلی، 936 پاره‌‌گفتار (شرکت‌‌کننده 39 × 2 الگوی زمانی × 12جفت‌جمله) به دست آمد. ضبط داده‌‌ها در یک اتاق آکوستیکی در سکوت کامل و با فرکانس نمونه‌‌برداری 11025 هرتز انجام شد.

 

5. الف) قیچیُ برداشتندُ پارچه رو بریدندُ برای عروس لباس دوختند.

ghejtʃi-o bardɑʃtan(d)-o pɑrtʃe ro boˈridan(d)-o barɑje ʔarus lebɑs duxtan(d).            (Past)          

   ب) رفتم خیاطی گفتم میشه مُدِلِ لباسمُ عوض کنم؟ گفت خیاطُ دستیارش پارچه رو بُریده‌‌اند.

Raftam xajɑti goftam miʃe model-e lebɑdam-o ʔavaz konam? Goft xajɑt-o dastjɑreʃ pɑrtʃe ro boriˈdan(d).                 (Perfect)

 

 6.الف) خیلی ناراحته دیروز پولش رو زدند.

Xejli nɑrɑhate diruz puleʃ ro ˈzadan(d).                 (past)

    ب) توی اتوبوس بوده که پولش زده‌‌اند.

Toj-e ʔotobus bud eke puleʃ-o zaˈdan(d).                (Perfect)

 

برای تجزیه و تحلیل آکوستیکی پاره‌‌گفتارها از نرم ‌‌افزار پرت ویرایش 29/0/6 استفاده شد. به‌منظور تحلیل آوایی داده‌‌ها از سیگنال آوایی، منحنی فرکانس پایه و منحنی شدت انرژی و طیف‌‌نگاشت بسته به متغیر آواییِ هدف آزمایش استفاده شد. برای تقطیع هجاییِ گفتار پیوسته جملات از معیارهای تقطیعِ پیترسون و لهیسته[15] (1960) استفاده شد.[16] بعد از تقطیع و مرز‌‌گذاری هجاهای هدف کلمات (ماضی ساده و ماضی نقلی) در شبکۀ متنی داده‌‌های صوتی، از نرم افزار ProsodyPro ویرایش 1/8/7/5 (Xu, 2018) برای محاسبه و اندازه‌‌گیری خودکار متغییرهای صوتی استفاده شد.

 

 

شکل 1- شکل موج و منحنی زیروبمی پاره‌‌گفتار «رضا پولی تو بساط نداره، یه هفته‌‌ایه که کیفشُ دزدیده‌‌اند» تولیدشده در گفتار یکی از شرکت‌‌کنندگان آزمایش. خطوط عمودی مرز بین کلمات را نشان می‌‌دهد. هجاهای [di] و [dan(d)] هجاهای هدف آزمایش هستند که به‌صورت دو محدودۀ زمانی A و B مشخص شده‌‌اند.

Fig 1- Waveform and pitch contour of the utterance ‘Reza has no money; it’s been a week that his wallet has been stolen’ produced by a participant. The vertical lines represent word boundary. [di] & [dan (d)] are target syllables defined as two temporal domains, namely A & B.

 

 

شکل 2- شکل موج و منحنی زیروبمی پاره‌‌گفتار «رضا از بانک که بیرون میومد، کیفشُ دزدیده‌‌اند» تولیدشده در گفتار یکی از شرکت‌‌کنندگان آزمایش. خطوط عمودی مرز بین کلمات را نشان می‌‌دهد. هجاهای [di] و [dan(d)] هجاهای هدف آزمایش هستند که به‌صورت دو محدوده زمانی A و B مشخص شده‌‌اند.

Fig 2- Waveform and pitch contour of the utterance ‘When Reza came out of the bank, his bag was stolen’ produced by a participant. The vertical lines represent word boundary. [di] & [dan (d)] are target syllables defined as two temporal domains, namely A & B.

 

در بررسی‌‌های اولیه، داده‌‌های آوایی 7 شرکت‌کننده از سطح تحلیل صوتی کنار گذاشته شد. برخی از این شرکت‌‌کنندگان جملات را با سرعت زیاد و غیرطبیعی تولید کرده بودند؛ برخی نیز کلمات هدف و یا دیگر کلمات درون جمله را با خوانش کانونی تولید کرده بودند که سبب می‌‌شد منحنی آهنگ جملات با منحنی‌‌های مدنظر پژوهشگران تفاوت‌‌های درخور توجهی داشته باشند. بر این اساس، تعداد کل داده‌‌هایی که در سطح تحلیل‌‌های صوتی اندازه گیری شدند عبارت بودند از 768 محرک.

مقادیر فرکانس پایه به‌صورت متوسط فرکانس پایه در طول واکه و مقادیر شدت انرژی به‌صورت متوسط شدت انرژی در طول هجاهای هدف اندازه‌‌گیری شدند. دیرش هجاهای هدف نیز از نقطۀ آغازین همخوان تا پایان واکه (منطبق بر پایان فرکانسِ F2)اندازه‌‌گیری شد. همچنین، برای هنجارسازی اندازه‌‌گیری‌‌های مربوط به فرکانس پایه، مقادیر اندازه‌‌ها از مقیاس خطی هرتز به مقیاس غیرخطی ای.آر.بی[17] تبدیل شد.

برای بررسی رفتار نوایی افعال ماضی نقلی و ماضی ساده، مقادیر پارامترهای متوسط فرکانس پایه (F0)، دیرش، بیشینة F0، شدت انرژی کل و دامنة زیروبمی (میزان اختلاف مقادیر بیشینه و کمینۀ F0) از سطح هجاهای جفت‌‌کلمات هدف آزمایش اندازه‌‌گیری و با یکدیگر مقایسه شد. برای مقایسۀ آماری اندازه‌‌های صوتی از آزمون آنالیز واریانس دو عامله استفاده شد. در این آزمون دو متغیر زمان فعل، با دو سطح گذشته ساده و ماضی نقلی، و هجا، با دوسطح هجای اول (A) و هجای دوم (B)، به‌عنوان متغییرهای مستقل و دیرش، بیشینة F0، شدت، متوسط F0 و دامنة زیروبمی به‌عنوان متغییر وابسته انتخاب شدند.

 

نتایج تحلیل آوایی داده‌‌ها

دیرش و شدت

فرض بر آن است که تکیه در افعال ماضی ساده بر روی هجای ماقبل پایانی (A) و ماضی نقلی بر روی هجای پایانی (B) قرار می‌‌گیرد. بر این اساس، مطابق با فرضیه‌‌های مطرح‌شده، انتظار داریم دیرش و شدت انرژی هجای A در افعال ماضی ساده بیشتر از همین هجا در ماضی نقلی و دیرش و شدت انرژی هجای B در افعال ماضی نقلی بیشتر از همین هجا در ماضی ساده باشد. شکل (3) متوسط مقادیر دیرش هجاهای A و B را در افعال ماضی ساده و ماضی نقلی در گفتار تمامی شرکت‌‌کنندگانِ آزمایش نشان می‌‌دهد.

همان طور که مشاهده می‌‌شود دیرش هجای B در گفتار اغلب شرکت‌‌کنندگان، مستقل از عامل زمان فعل، از دیرش هجای A بیشتر است. این ویژگی از کشش اجباری واکة پایانی پاره‌گفتار ناشی می‌شود که اهل زبان از آن برای نشان دادن خاتمة گفتار استفاده می‌کنند. همچنین، دیرش هجای B در افعال ماضی نقلی از همین هجا در افعال ماضی ساده بیشتر است. ولی دیرش هجای A تفاوت درخور توجهی را بین این دو دسته از افعال نشان نمی‌‌دهد.

جدول (1) خلاصۀ نتایج آزمون آماری آنووای دوعامله را برای بررسی معنادار بودن اثر دو عامل مستقل زمان (ماضی ساده و ماضی نقلی) و محدودۀ هجایی (A و B) بر دیرش نشان می‌‌دهد. این جدول نشان می‌‌دهد اثر متغیر مستقل محدودۀ هجا بر مقادیر دیرش معنادار نیست؛ ولی اثر متغیر مستقل زمان فعل بر مقادیر دیرش هجا معنادار است. همچنین، اثر تعاملی ناحیة زمانی و زمان فعل بر مقادیر دیرش معنادار نیست.

برای شدت انرژی نیز نتایج مشابهی حاصل شد. شکل (4) متوسط مقادیر شدت هجاهای A و B را در افعال ماضی ساده و ماضی نقلی در گفتار تمامی شرکت‌‌کنندگانِ آزمایش نشان می‌‌دهد. همان طور که مشاهده می‌‌شود شدت هجای A مستقل از عامل زمان فعل، از شدت هجای B بیشتر است. همچنین، شدت هجای B در افعال ماضی نقلی از همین هجا در افعال ماضی ساده بیشتر است. ولی شدت هجای A تفاوت قابل ملاحظه‌‌ای را بین این دو دسته افعال نشان نمی‌‌دهد.

 

 

شکل 3- میانگین دیرش در دو محدودة هجایی ماقبل پایانی (A) و هجای پایانی (B) جفت‌‌واژه‌‌های هدف در دو بافت زمانی ماضی ساده و ماضی نقلی

Fig 3- Mean duration of the two syllable domains A (per-final syllable) & B (final syllable) in the target word pairs for simple past & present perfect for the eight participants of the experiment

 

جدول 1- خلاصة نتایج آزمون‌‌ تحلیل واریانس دوعامله برای محاسبة سطح معناداری اثر عوامل زمان و محدوده هجایی بر مقادیر دیرش در جفت واژه‌‌های تکیه‌‌ایِ هدف آزمایش

Table 1- Summary of analysis of variance (ANOVA) for the effect of tense and syllable domain on duration in the target word pairs.

متغیر

F مقدار

سطح معناداری

زمان                 

F(1,766)= 18.29,

 

      p<0.000

محدوده

F(1, 766)=0.65,

 

      p=0.47

زمان ₓ محدوده

F(1, 766)=0.048,

 

      P=0.85

 

جدول (2) خلاصۀ نتایج آزمون آماری تحلیل واریانس دوعامله را برای بررسی معنادار بودن اثر دو عامل مستقل زمان، شامل دو سطح ماضی ساده و ماضی نقلی، و محدودۀ هجایی (A و B) بر شدت انرژی نشان می‌‌دهد. این جدول نشان می‌‌دهد که اثر متغیر مستقل محدودۀ هجا بر مقادیر شدت انرژی معنادار نیست. همچنین، اثر متغیر مستقل زمان ‌‌فعل و اثر تعاملی زمان فعل و محدودۀ هجایی بر مقادیر شدت هجا معنادار نیست.

 

شکل 4- میانگین شدت انرژی در دو محدودة هجایی ماقبل پایانی (A) و هجای پایانی (B) جفت‌‌واژه‌‌های هدف در دو بافت زمانی ماضی ساده و ماضی نقلی.

Fig 4- Mean overall intensity of the two syllable domains A (per-final syllable) & B (final syllable) in the target word pairs for simple past & present perfect for the eight participants of the experiment.

 

جدول 2- خلاصة نتایج آزمون‌‌ تحلیل واریانس دوعامله برای محاسبة سطح معناداری اثر عوامل زمان و محدوده هجایی بر مقادیر شدت انرژی در جفت واژه‌‌های تکیه‌‌ایِ هدف آزمایش

Table 2- Summary of analysis of variance (ANOVA) for the effect of tense and syllable domain on overall intensity in the target word pairs.

متغیر

F مقدار

سطح معناداری

زمان                 

F(1, 766)= 10.34,

 

      p<0.000

محدوده

F(1, 766)=1.57,

 

      p=0.29

زمان ₓ محدوده

F(1, 766)=1.04,

 

      P=0.36

 

به‌‌طور کلی، این نتایج نشان می‌‌دهد تکیه بر روی محور هم‌نشینی بر دیرش و شدت انرژی هجاهای افعال ماضی ساده و ماضی نقلی (مقایسه درون فعلی هجاها) اثر نظام‌‌مند ندارد؛ زیرا در حالی که انتظار داریم هجای ماقبل پایانی افعال ماضی ساده نسبت به هجای پایانی این افعال و هجای پایانی افعال ماضی نقلی نسبت به هجای ماقبل پایانی این افعال دیرش و شدت بیشتری داشته باشند، این انتظار تنها دربارۀ افعال ماضی نقلی محقق شد و افعال ماضی ساده تفاوت نظام‌‌مندی را از نظر این دو پارامتر صوتی بر روی محور هم‌‌نشینی نشان ندادند. از سوی دیگر، مقایسۀ دیرش و شدت انرژی هجاها بر روی محور جانشینی (مقایسۀ بین ‌‌فعلی هجاهای یکسان) نیز تفاوت‌‌های نظام‌‌مندی را نشان نداد. در حالی که دیرش و شدت انرژی هجای پایانی افعال ماضی نقلی در گفتار اغلب شرکت‌‌کنندگان به‌‌‌طور معناداری از دیرش و شدت همین هجا در افعال ماضی ساده بیشتر بود، هجای ماقبل پایانی این افعال با یکدیگر اختلاف معناداری نداشتند. این نتایج به‌‌‌طور کلی نشان می‌‌دهد دیرش و شدت انرژی، پارامترهای صوتی چندان معتبری برای تمایز آوایی افعال ماضی نقلی و ساده نیستند.

 

تغییرات زیروبمی (F0)

 مطابق با الگوی تغییرات F0 در ساخت آهنگ گفتار فارسی (صادقی، 1397) انتظار داریم مقادیر سه پارامتر زیروبمی یعنی بیشینة F0، متوسط F0 و دامنۀ زیروبمی در هجای A افعال ماضی ساده بیشتر از همین هجا در ماضی نقلی و بالعکس مقادیر همین پارامترها در هجای B در افعال ماضی نقلی بیشتر از همین هجا در ماضی ساده باشد. شکل‌‌های 5، 6 و 7 به‌ترتیب میانگین مقادیر بیشینة F0، متوسط F0 و دامنۀ زیروبمی هجاهای A و B را در افعال ماضی ساده و ماضی نقلی در گفتار تمامی شرکت‌‌کنندگان آزمایش نشان می‌‌دهد. همان طور که مشاهده می‌‌شود بیشینة F0 (شکل 5) و متوسط F0 (شکل 6) هجاهای  AوB  در هر دو دسته افعال ماضی ساده و ماضی نقلی با هم تقریباً برابر است. همچنین، هیچ‌یک از هجاهای A و  Bتفاوت قابل ملاحظه‌‌ای را در بُعد جانشینی بین این دو دسته افعال نشان نمی‌‌دهد. از سوی دیگر، دامنة زیروبمی (شکل 7) هجای B مستقل از عامل زمان فعل، از دامنة زیروبمی هجای A بیشتر است (در حالی که انتظار داریم این تفاوت‌‌ها وابسته به زمان فعل باشد؛ یعنی برای مثال، دامنة زیروبمی هجای A در ماضی ساده از هجای B در همین مقولۀ زمانی بیشتر باشد). همچنین، اختلاف دامنة زیروبمی هجاها در افعال ماضی نقلی و ماضی ساده از الگوی منظمی پیروی نمی‌‌کند.

جدول‌‌ (3) خلاصۀ نتایج آزمون آماری تحلیل واریانس دوعامله را برای بررسی معنادار بودن اثر دو عامل مستقل زمان و محدودۀ هجایی بر مقادیر سه پارامتر زیروبمی یعنی بیشینة F0، متوسط F0 و دامنۀ زیروبمی نشان می‌‌دهد. این جدول‌‌ها نشان می‌‌دهند که اثر متغیر مستقل محدودۀ هجا بر مقادیر بیشینة F0، متوسط F0 و دامنۀ زیروبمی معنادار نیست. همچنین، اثر متغیر مستقل زمان ‌‌فعل و همچنین، اثر تعاملی ناحیة زمانی و مقولة فعل بر مقادیر این پارامترها معنادار نیست.

 

 

شکل 5- میانگین بیشینۀ F0 در دو محدودة هجایی ماقبل پایانی (A) و هجای پایانی (B) جفت‌‌واژه‌‌های هدف در دو بافت زمانی ماضی ساده و ماضی نقلی.

Fig 5- Mean Max F0 of the two syllable domains A (per-final syllable) & B (final syllable) in the target word pairs for simple past & present perfect for the eight participants of the experiment.

 

شکل 6- میانگین مقادیر متوسط F0 در دو محدودة هجایی ماقبل پایانی (A) و هجای پایانی (B) جفت‌‌واژه‌‌های هدف در دو بافت زمانی ماضی ساده و ماضی نقلی.

Fig 6- Mean F0 of the two syllable domains A (per-final syllable) & B (final syllable) in the target word pairs for simple past & present perfect for the eight participants of the experiment.

 

 

شکل 7- میانگین مقادیر دامنۀ زیروبمی در دو محدودة هجایی ماقبل پایانی (A) و هجای پایانی (B) جفت‌‌واژه‌‌های هدف در دو بافت زمانی ماضی ساده و ماضی نقلی در گفتار 8 شرکت‌‌کنندۀ آزمایش.

Fig 7- Mean excursion size of the two syllable domains A (per-final syllable) & B (final syllable) in the target word pairs for simple past & present perfect for the eight participants of the experiment.

 

 

جدول 3- خلاصة نتایج آزمون‌‌ تحلیل واریانس دوعامله برای محاسبة سطح معناداری اثر تعاملی عوامل زمان و محدوده هجایی بر مقادیر بیشینة F0، متوسط F0 و دامنۀ زیروبمی در جفت واژه‌‌های تکیه‌‌ایِ هدف

Table 3- Summary of analysis of variance (ANOVA) for the effect of tense and syllable domain on Max F0, Mean F0 and Excursion size in the target word pairs.

گوینده

زمان

محدوده

زمان محدوده

     بیشینۀ F0

F(1,44)=0.62,

      p=0.43

F(1,20)=0.94,

      p=0.34

F(1,44)=0.086,

       p=0.79

متوسط F0

F(1,44)=0.34,

      p=0.56

F(1,28)=0.27,

      p=0.59

F(1,28)=0.84,

      p=0.37

دامنۀ زیروبمی

F(1,20)=0.77,

      P=0.43

(1,24)=0.18,

     p=0.82

F(1,20)=0.59,

      p=0.47

 

به‌‌طور کلی، این نتایج نشان می‌‌دهد تکیه بر روی محور هم‌نشینی بر مقادیر هیچ‌یک از پارامترهای بیشینة F0، متوسط F0 و دامنۀ زیروبمی هجاهای افعال ماضی ساده و ماضی (مقایسۀ درون فعلی هجاها) نقلی اثر نظام‌‌مند ندارد. به عبارتی، در حالی که انتظار داریم هجای ماقبل پایانی افعال ماضی ساده نسبت به هجای پایانی این افعال و هجای پایانی افعال ماضی نقلی نسبت به هجای ماقبل پایانی این افعال مقادیر بیشینة F0، متوسط F0 و دامنۀ زیروبمی بیشتری داشته باشند، هیچ‌یک از دو دسته افعال ماضی ساده و نقلی تفاوت نظام‌‌مندی را برحسب این پارامترها بر روی محور هم‌نشینی نشان ندادند. از سوی دیگر، مقایسۀ مقادیر این پارامترهای زیروبمی بر روی محور جانشینی (مقایسۀ بین فعلی هجاهای یکسان) نیز تفاوت‌‌های نظام‌‌مندی را نشان نداد؛ یعنی برخلاف انتظار مقادیر بیشینة F0، متوسط F0 و دامنۀ زیروبمی هجای پایانی افعال ماضی نقلی به‌‌‌طور معناداری از بیشینة F0 همین هجا در افعال ماضی ساده بیشتر نبود. همین ‌‌طور، مقادیر بیشینة F0، متوسط F0 و دامنۀ زیروبمی هجای ماقبل پایانی این افعال با یکدیگر اختلاف معناداری نداشتند. این نتایج به‌‌‌‌‌طور کلی نشان می‌‌دهد پارامترهای زیروبمی بیشینة F0، متوسط F0 و دامنۀ زیروبمی هم‌‌بسته‌‌های معتبری برای تمایز آوایی افعال ماضی نقلی و ساده نیستند. 

به‌طور کلی، نتایج به‌دست‌آمده از تحلیل آماری پارامترهای صوتی انتخاب‌شده نشان داد که هیچ کدام از پارامترها نمی‌‌تواند به‌‌‌طور منظم و پایدار الگوی نوایی افعال ماضی ساده و نقلی را از یکدیگر متمایز کند. برای بررسی دقیق علل این موضوع و انتخاب پارامتر صوتی مطمئن برای تمایز داده‌‌های آوایی پژوهش منحنی میانگین تغییرات فرکانس پایه را از طریق هنجارسازی مقادیر فرکانس پایه طی 20 نقطۀ زمانی در طول هجاهای A (10 نقطه) و B (10 نقطه) در گفتار هریک از هشت شرکت‌‌کننده آزمایش (شکل 8) به دست آوردیم.

 

شکل 8- منحنی‌‌های هنجارشده دو هجای پایانی افعال ماضی ساده (آبی) و ماضی نقلی (قرمز) در گفتار هر شرکت‌‌کنندة. منحنی‌‌ها با محاسبه میانگین مقادیر فرکانس پایۀ هجاها در سطح تمامی داده‌‌های هدف آزمایش به دست آمده‌‌اند.

Fig 8- Normalized pitch contours of the last two syllables in simple Past (blue) & present Perfect (red) verbs for each participant. The pitch contours were computed by measuring F0 for all the target syllables.

 

بررسی‌‌ها نشان داد علت آن که پارامترهای وابسته به F0، یعنی متوسط F0، بیشینه F0 و دامنه زیروبمی، قادر به تمایز صورت آوایی ماضی ساده و ماضی نقلی نیستند این است که سطح فرکانس پایه در طول هجاهای هدف (A و B) افعال، به‌ویژه در نواحی آغازی و پایانی این هجاها، تغییرات پیش‌‌بینی‌‌نشده‌‌ای دارد. برای مثال، در حالی که انتظار می‌‌رود سطح فرکانس پایه هجای B در افعال ماضی ساده در طول محدوده زمانی این هجا سطحی کمینه باشد، این‌‌گونه نیست و سطح این پارامتر صوتی در انتهای هجای B در گفتار اغلب شرکت‌‌کنندگان افزایش نشان می‌‌دهد. همچنین، در حالی که انتظار می‌‌رود سطح فرکانس پایه هجای A در افعال ماضی نقلی در طول محدودۀ زمانی این هجا سطحی کمینه باشد، این‌‌گونه نیست و سطح این پارامتر صوتی در ابتدای محدودۀ زمانی این هجا بالاتر از سطح مورد انتظار است. این تغییرات پیش‌‌بینی‌‌نشده باعث شده است که اندازه‌‌گیری‌‌های مربوط به پارامترهای متوسط F0، بیشینه F0 و دامنۀ زیروبمی نتوانند به ‌‌طور پایدار و کارامد، صورت صوتی افعال ساده و نقلی را از یکدیگر متمایز کند.

اما دقت در منحنی‌‌های هنجارشده یک واقعیت اساسی را نشان می‌‌دهد: در هر نقطه‌‌ای از منحنی در طول هجاهای A (10 نقطۀ آغازی) یا B (10 نقطۀ پایانی) که در یک عضو از جفت فعل‌‌های ساده یا نقلی یک قله زیروبمی واقع شده است، در همان نقطۀ زمانی در عضو دیگر، یک درّه F0 ایجاد شده است. به‌‌‌طور مشخص، طی 10 نقطۀ زمانی آغازی (هجای A) افعال ماضی ساده، یک قله در یک نقطۀ زمانی خاص واقع شده است که دقیقاً در همان نقطۀ زمانی طی همین محدوۀ 10 نقطه‌‌ای در منحنی هنجارشده افعال ماضی نقلی یک درّه ایجاد شده است. همین‌‌طور، طی 10 نقطۀ زمانی پایانی (هجای B) افعال ماضی نقلی، یک قله در یک نقطۀ زمانی خاص واقع شده است که دقیقاً در همان نقطۀ زمانی طی همین محدودۀ10 نقطه‌‌ای در منحنی هنجارشده افعال ماضی ساده یک درّه ایجاد شده است. این واقعیت مؤید آن است که آنچه اساساً باعث تمایز صوتی صورت آوایی افعال ماضی ساده و نقلی از نظر الگوی تغییرات زیروبمی می‌‌شود، رویدادهای محلی در نقاط زمانی مشخص در سطح منحنی تغییرات زیروبمی این افعال است. برای کمّی‌‌سازی این تفاوت بین منحنی زیروبمی افعال ماضی ساده و نقلی، مقادیر فرکانس پایه را در محل وقوع هر قله در یک فعل و درّه متناظرش در فعل دیگر اندازه‌‌گیری کردیم و این پارامتر جدید را فرکانس پایۀ محلی[18] نامیدیم. 

مقایسه‌‌های انجام‌شده بر روی محور جانشینی نشان داد فرکانس پایۀ محلی هجای A در افعال ماضی ساده از همین هجا در افعال ماضی نقلی بیشتر است. همچنین، فرکانس پایۀ محلی هجای B در افعال ماضی نقلی از همین هجا در افعال ماضی ساده بیشتر است. مقایسه‌‌ها بر روی محور هم‌نشینی نیز نشان داد مقادیر این پارامتر در هجای A در افعال ماضی ساده از هجای B در همین افعال بیشتر است. همچنین، مقادیر این پارامتر در هجای B در افعال ماضی نقلی از هجای A در همین افعال بیشتر است (شکل 9).

 نتایج آزمون آماری مربوطه (جدول 6) نشان داد اثر متغیر مستقل محدودۀ هجا، زمان ‌‌فعل و اثر تعاملی ناحیة زمانی و مقولة فعل بر مقادیر فرکانس پایه محلی معنادار است.

براساس این نتایج هر دو دسته افعال ماضی نقلی و ماضی ساده تفاوت نظام‌‌مندی را از نظر فرکانس پایۀ محلی بر روی محور هم‌نشینی نشان می‌‌دهند. از سوی دیگر، مقایسه هجاها بر روی محور جانشینی (مقایسه بین فعلی هجاهای یکسان) نیز تفاوت‌‌های نظام‌‌مند و پایداری را از نظر این پارامتر صوتی جدید نشان می‌‌دهد. این نتایج به‌‌طور کلی نشان می‌‌دهد فرکانس پایۀ محلی پارامتر صوتی معتبر و کارامدی برای تمایز آوایی افعال ماضی نقلی و ساده است.

 

 

شکل 9- میانگین مقادیر فرکانس پایۀ محلی در دو محدودة هجایی ماقبل پایانی (A) و هجای پایانی (B) جفت‌‌واژه‌‌های هدف در دو بافت زمانی ماضی ساده و ماضی نقلی.

Fig 9- Mean local F0 values of the two syllable domains A (per-final syllable) & B (final syllable) in the target word pairs for simple past & present perfect.

 

جدول 4- خلاصة نتایج آزمون‌‌ تحلیل واریانس دوعامله برای محاسبة سطح معناداری اثر تعاملی عوامل زمان و محدوده هجایی بر مقادیر فرکانس پایۀ محلی در جفت‌واژه‌‌های تکیه‌‌ایِ هدف

Table 4- Summary of analysis of variance (ANOVA) for the effect of tense and syllable domain on Local F0 in the target word pairs

متغیر

F مقدار

سطح معناداری

زمان                 

F(1, 766)= 22.49,

 

      p<0.000

محدوده

F(1, 766)=16.81,

 

      p<0.000

زمان ₓ محدوده

F(1, 766)=31.43,

 

      p<0.000

 

بحث و نتیجه‌‌گیری

در این پژوهش به بررسی و تحلیل آواشناختی عوامل تولیدی-صوتی در تمایز افعال ماضی ساده و ماضی نقلی در زبان فارسی پرداختیم و تأثیر تکیه در پردازش آوایی این افعال را با استفاده از روش‌‌شناسی آزمایشگاهی بررسی کردیم.

یافته‌‌های به‌دست‌آمده نشان داد هیچ‌یک از هم‌‌بسته‌‌های صوتی محتمل تکیه شامل دیرش، شدت انرژی و پارامترهای مبتنی بر F0 (مثل بیشینة F0، متوسط F0 و دامنة زیروبمی) در ایجاد تمایز بین افعال ماضی ساده و ماضی نقلی فارسی (بر روی هیچ‌یک از دو محور جانشینی و همنشینی) موفق عمل نمی‌‌کنند. در بررسی‌‌ها بیشتر معلوم شد که عامل اصلی تمایز صوتی صورت آوایی افعال ماضی ساده و نقلی برخی رویدادهای زیروبمی محلی در نقاط زمانی مشخص در سطح منحنی تغییرات زیروبمی این افعال است. بر این اساس، برای کمّی‌‌سازی این تفاوت، مقادیر فرکانس پایه در محل وقوع هر قله در یک فعل و درّه متناظرش در فعل دیگر را اندازه‌‌گیری کردیم و آن را فرکانس پایۀ محلی نامیدیم.

 نتایج به‌‌دست‌آمده نشان داد فرکانس پایة محلی (ارتفاع قله) پارامتر صوتی معتبر و باثباتی است که صورت آوایی افعال ماضی ساده و ماضی نقلی را بر روی هر دو محور جانشینی و هم‌نشینی از یکدیگر متمایز می‌‌کند.

از دیدگاه نظری، یافته‌‌های این پژوهش فرضیۀ توالی اهداف نواختیِ نظریه خودواحد عروضی را تأیید می‌‌کند. براساس این فرضیه هر تغییر زیروبمی به شکل توالی‌‌ای از اهداف نواختیِ L و  Hکه با نقاط زنجیره‌‌ایِ مشخصی در ساخت واجی انطباق دارند، توصیف می‌‌شود. این فرضیه در تقابل با دیدگاه شکل‌‌گرا است که در آن، شکل کلی یک تغییر زیربمی، مبنای توصیف منحنی آهنگ قرار می‌‌گیرد. در دیدگاه شکل‌‌گرا برای مدل‌‌سازی تفاوتِ کلی منحنی‌‌های زیروبمی، مقادیر پارمترهایی همچون بیشینة F0، متوسط F0 و دامنة زیروبمی از سطح هر هجا محاسبه و جمع‌‌آوری می‌‌شود. فرض بر آن است که هر هجا، الگوی زیروبمیِ خاصی دارد و شکل کلیِ منحنی زیروبمی آن، تابع عواملِ نقشی، مانند نقش‌‌های معنایی، کاربردشناختی و یا حالات دستوری است (Xu and Xu, 2005). دیدگاه شکل‌‌گرا منحنی آهنگ این دو خوانش دستوری را در قالب یک طرحِ کلی زیروبمی (که از طریق مقادیر پارامترهایی مانند بیشینة F0، متوسط F0 و دامنة زیروبمی قابل محاسبه است)، بدون ملاحظه تغییراتِ زیروبمی محلی توصیف می‌‌کند. محل وقوع قله و دره F0 در منحنی‌‌ زیروبمی افعال در این دیدگاه به کلی نادیده گرفته می‌‌شود. این در حالی است که عامل اصلی تمایزِ منحنی‌‌های افعال از یکدیگر مطابق با شکل (6) محل وقوع قله و دره F0 بر روی منحنی زیروبمی است؛ زیرا در هر نقطه‌‌ای از منحنی زیروبمی افعال ساده یا نقلی که در آن یک قله زیروبمی واقع شده است، در همان نقطۀ زمانی در فعل دیگر، یک درّه F0 ایجاد شده است. بر این اساس، شواهد آزمایشگاهی ارائه‌شده در این پژوهش نشان می‌‌دهد آنچه اساساً باعث تمایز صوتی بین منحنی زیروبمی افعال ماضی ساده و ماضی نقلی می‌‌شود، شکل کلیِ منحنی‌‌ها نیست، بلکه وجود برخی رویدادهای محلی به‌صورت نقاط (یا سطوح) حداقلی و حداکثری F0 در سطح منحنی زیروبمی است که کیفیت صوتی آنها را از یکدیگر متمایز می‌‌کند. این نقاط، در دیدگاه خودواحد عروضی نقاط گذار[19] نامیده شده‌‌اند و بر اهمیت زبان‌شناختی آنها در مطالعات آزمایشگاهی مختلف تأکید شده است.

 



[1]. D. B. Fry

[2]. M. E. Beckman & J. Edwards

[3]. A. M. Sluijter & V. van Heuven

[4]. N. Campbel, & M. E. Beckman

[5]. M. Ortega-Llebaria, & P. Prieto

[6]. Catalan

[7]. Castilian

 .[8] فَندِرهالست (2011) تکیه را با استفاده از دو اصطلاح تکیه-آهنگی و زیروبمی-آهنگی تعریف می‌کند و تفاوت بین این دو مؤلفه در منحنی آهنگ گفتار  را با تفاوت در میزان خیزشان مشخص می‌‌کند. او معتقد است اصطلاح زیروبمی یک مفهوم مجزا از تکیة واژگانی است و نمی‌‌تواند یک همبستة آوایی-واجی برای آن باشد. از نظر او نظام نواختی با استفاده از تقابل‌‌های دوگانة H وL به‌خوبی می‌‌تواند تکیة زیروبمی را مشخص و توصیف کند.

[9]. H. G. van der Hulst

[10]. C. Gussenhoven

[11]. T. Rietveld

[12]. S. A. Jun

[13]. Baining gok

.[14]  با توجه به ویژگی‌‌های نوایی زبان فارسی، معیار وجود تکیة زیروبمی در یک کلمه را وجود یک خیز بر روی هجای تکیه‌‌بر در نظر گرفتیم.

[15]. G. E. Peterson & I. Lehiste

[16] . در صورت هم‌پوشی یا هم‌‌تولیدی یک واکه با همخوان، مرزگذاری‌‌ها با توجه به طیف فرکانسی و الگوی توزیع انرژی در سازه‌‌های فرکانسی انجام شد.

[17]. ERB

[18]. local frequency F0

[19]. turning points

اسلامی، محرم. (1388). تکیه در زبان فارسی. پردازش علائم و داده‌‌ها، 1(11)، 12-3.
سامعی، حسین. (1374). تکیة فعل در زبان فارسی: بررسی مجدد. فصلنامة فرهنگستان زبان و ادب فارسی، 1(4)، 55-68.
صادقی، وحید. (1392). بررسی آوایی تکیة واژگانی در زبان فارسی. زبان پژوهی، 5(9)، 95-121.
صادقی، وحید. (1397). ساخت نوایی زبان فارسی: تکیة واژگانی و آهنگ. تهران: سمت.
Abolhasanizadeh, V., Bijankhan, M., & Gussenhoven, C. (2012). The Persian pitch accent and its retention after the focus. Lingua, 122 (13), 1380-1394.
Beckman, M.E. (1986). Stress and non-stress accent. Dordrecht: Foris. https://doi.org/
10.1515/9783110874020.
Beckman, M. E. & Edwards, J. (1994). Articulatory evidence for differentiating stress categories. In P. A. Keating (Ed.), Phoological structure andphonetic from: Papers in laboratory phonology (pp. 7-33). Cambridge: Cambridge University Press.
Campbel, N. & Beckman. M. E. (1997). Stress, prominence and spectral tilt. In A. Botinis, G.
Kouroupetroglou, & G. Carayiannis (Eds.), Intonation: Theory, models and applications (pp. 67-70). Athens: ESCA.
Eslami, M. (2009).word stress in Persian language. Signal & data processing, 1 (11), 3-12. [In Persian]
Ferguson, C. (1957). Word stress in Persian. Language, 33, 123-135. https://doi.org/ 10.2307/410724.
Fry, D. B. (1955). Duration and intensity as physical correlates of linguistic stress. The Journal of the Acoustical Society of America, 27 (4), 765-768. https://doi.org/10.1121/1.1908022.
Gili Gaya, S. (1975). Elementos de fonética general. Italy: Gredos.
Gussenhoven, C. (2004). The phonology of tone and intonation. Cambridge: Cambridge University Press. https://doi.org/ 10.1017/cbo9780511616983.
Hyman, L. M. (2014). Do all languages have word accent? In van der Hulst, H. (Ed.), Word stress: Theoretical and typological Issues (pp. 56-82). Cambridge: Cambridge University Press.
Hyman, L. M. (2009). How (not) to do phonological typology: the case of pitch-accent. Language Sciences31, 213-38. https://doi.org/10.1016/j.langsci.2008.12.007.
Hyman, L. M. (2006). Word-prosodic typology. Phonology, 23, 225-257.
Jun, S. A. (Ed.) (2005). Prosodic typology: The Phonology of intonation and Phrasing. Oxford: Oxford University Press. https://doi.org/10.1017/s0952675708001516.
Lehiste, I. (1970). Suprasegmentals. Cambridge, MA: The MIT. Press.
Levi, S. V. (2005). Acoustic correlates of lexical accent in Turkish. Journal of the International Phonetic Association, 35, 73-97. https://doi.org/10.1017/s0025100305001921.
Ortega-Llebaria, M., & Prieto, P. (2010). Acoustic correlates of stress in Central Catalan and Castilian Spanish. Journal of Language and speech, 54, 73-97.
Ortega-Llebaria, M., Vanrell, M. M., & Prieto, P. (2010). Catalan speakers’ perception of word stress in unaccented contexts. Journal of Acoustical Society of America, 127, 462-471.
Peterson, G. E., & Lehiste, I. (1960). Duration of syllable Nuclei in English. Journal of the Acoustical Society of America, 32 (6), 693–703. https://doi.org/10.1121/1.1908183
Pierrehumbert, J. & Beckman, M. E. (1988). Japanese tone structure. Cambridge, MA: The MIT Press.
Rahmani, H., Rietveld, T., & Gussenhoven, C. (2015). Stress “Deafness” reveals absence of lexical marking of stress or tone in the adult grammar. PLoS ONE, 10 (12), e0143968.
Recasens, D. (1986). Estudis de fonètica experimental del català oriental central. Barcelona: Publicacions de l'Abadia de Montserrat.
Sadeghi, V. (2017). Word-level prominence in Persian: An experimental study. Journal of Language and Speech, 26 (1), 571-596. https://doi.org/10.1177/0023830916684862.
Sadeghi, V. (2013). Phonetic study of lexical stress in Persian. Language research, 5 (9), 95-121. [In Persian]
Sadeghi, V. (2018). The Prosodic structure of the Persian Language: lexical stress & intnation. Tehran: SAMT. [In Persian]
Samaei, H (1995). Verb Stress in Persian: A reanalysis. Persian Language & Literature Quarterly. 1 (4), 55-68. [In Persian]
Sluijter, A. M., & van Heuven, V. (1996 a). Spectral balance as an acoustic correlate of linguistic stress.  Journal of the Acoustical society of America, 100 (4), 2471-2485.
Sluijter, A. M., & van Heuven, V. (1996 b). Acoustic correlates of linguistic stress and accent in Dutch and American English. Proceedings of ICSLP, 96, 630-633. Philadelphia, PA: Applied Science and Engineering Laboratories, Alfred I. duPont Institute.
van der Hulst, H.G. (2012). Deconstructing stress. Lingua, 122 (13), 1494-1521.
van Heuven, V. & de Jonge, M. (2010). Spectral and temporal reduction as stress cues in Dutch. Phonetica, 68, 120-132. https://doi.org/10.1159/000329900. 
Xu, Y. (2018). ProsodyPro – a tool for large-scale systematic prosody analysis. Tools and Resources for the Analysis of Speech Prosody (TRASP), 2013, 7–10.         
Xu, Y., & Xu, C. X. (2005). Phonetic realization of focus in English declarative intonation. Journal of Phonetics, 33, 159-197. https://doi.org/10.1016/j.wocn.2004.11.001.