نام پژوهشگر: سید مصطفی عاصی

بررسی روشها و معیارهای کاربرد پیکره ها در آموزش زبان، با توجه ویژه به زبان فارسی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه علامه طباطبایی - دانشکده ادبیات و زبانهای خارجی 1389
  منیره ترابی   سید مصطفی عاصی

زبان شناسی پیکره ای، شاخه ای از زبان شناسی است که به گردآوری و تحلیل پیکره ها می پردازد. پیکره مجموعه ای از پاره های زبانی است که انتخاب و براساس معیارهای زبانی روشنی مرتب می شوند به نحوی که همچون نمونه ای از زبان به کار گرفته می شوند. زبان شناسی پیکره ای با استخراج خودکار داده های زبانی از پیکره ها؛ پردازش برون داد با روش های عمدتاً آماری؛ ارزیابی و تفسیر این گونه داده های پردازش شده به فراهم آوردن دانش تجربی زبانی کمک می کند. امروزه از پیکره های الکترونیکی می توان به طور مستقیم یا غیر مستقیم در آموزش بهره جست. هدف پژوهش حاضر، نخست پرداختن به نقش پیکره ها در زبان و آموزش زبان، به ویژه زبان فارسی است، سپس ارائ? پیکر? آموزشی مناسب با پرسش های تحقیق برای فارسی آموزان خارجی. مزایای استفاده از پیکره های آموزشی عبارت است از: مواجه شدن زبان آموز با داده های زبان واقعی، یادگیری داده-بنیاد یا زبان آموز به مثابه محقق، یادگیری اکتشافی یا زبان آموز به مثابه سیاح، یادگیری زبان به مثابه بازسازی. به علاوه، از طریق حجم بزرگی از داده ها و نیز خلاصه شدن اطلاعات زبانی در آنها زبان آموز موفق به یافتن واژه های هم بافت می شود. با تشویق زبان آموز به جست وجو در پیکره، این امکان برای او به وجود می آید که به گشت و گذار در متن بپردازد و بتواند برونداد زبانی خود را با زبان گویشور بومی مقایسه کند و خطاهای رایج خود را بیابد. پیکره های رایانه ای موجود برای زبان فارسی، پیکره هایی هستند که برای فارسی زبانان تدوین شده اند و از متون و شواهدی بهره جسته اند که برای فارسی آموزان خارجی دشوار به نظر می رسد. پیکر? پژوهش حاضر، یک پیکر? 60000 واژه ای متشکل از 60 نمون? 1000 واژه ای از متون نوشتاری از 12 ژانر مختلف متون معاصر است، در انتخاب متنهای نوشتاری، چهار معیار دخیل بوده اند: ژانر، زمان، رسانه و اعتبار مولف. پیکر? پژوهش، در مقایسه با پیکره های موجود در زبان فارسی، بسیار کوچک است و همین امر، استفاده از این پیکره را برای فارسی آموزان خارجی، مفید و مناسب ساخته است زیرا فهرست واژه یاب بسیار محدود است و کار با پیکره را آسان می سازد. حجم بالای فهرست واژه یاب نیازمند تحلیل های آماری و ماشینی توسط کارشناس است و کاربرپسند نیست. این پیکره تنها مجموعه ای از مواد خام زبانی نیست بلکه متن ها دارای شناس? متن هستند و هریک از واژه ها نیز به لحاظ اجزای کلام دستی نشانه گذاری شده اند. نیز به همراه هر واژه صورت تلفظی آن هم آمده است

منبع دستوری زبان فارسی در نرم افزار برنامه نویسی "چارچوب دستوری" (جی اف) (پژوهشی در زبان شناسی رایانه ای)
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه علامه طباطبایی - دانشکده ادبیات و زبانهای خارجی 1389
  صدیقه مرادی   سید مصطفی عاصی

زبان های طبیعی نظام های پیچیده ای هستند و ایجاد دستورهای رایانه ای برای آن ها، هم به دانش زبان شناختی و هم به داشتن دانشی درباره زبان های برنامه نویسی نیاز دارد. هدف چارچوب دستوری (جی اف) آن است تا این فرایند را هموارتر نماید. جی اف یک زبان برنامه نویسی تابعی است که با استفاده از فنآوری نوین طراحی شده و در آن، مدل معنایی نظریه انواع با برنامه نویسی تابعی در می آمیزد تا سامانه ای را پدید آورد که به توصیف زبان های طبیعی و تعمیم های زبانی کمک کند. عنصر اصلی در این توصیفات، موضوعی دستوری است که صرفاً یک زنجیره زبانی نیست، بلکه رکوردی است که اطلاعات تصریفی و ویژگی های ذاتی دستوری، مثل شمار و جنس دستوری، را در بر می گیرد. این موضوعات زبانی، همچنین سامانه نوعی دارند که در روند پردازش زبان به بازیابی و رفع خطاهای دستور کمک می کند. کتابخانه منبع دستوری جی اف مجموعه ای از دستور زبان هایی است که در قالب جی اف تدوین شده اند، و تا حد زیادی با هم مطابقت دارند زیرا همگی بر پایه نحو انتزاعی، یا ساختار درختی، مشترکی ساخته شده اند. از کلیدی ترین مفاهیم در جی اف، تمایز میان دو سطح از دستور است: نحو انتزاعی و نحو عینی. در نحو انتزاعی به ساخت-های درختی پرداخته می شود، و نحو عینی به چگونگی خطی شدن این درخت ها در هر یک از زبان های طبیعی اختصاص دارد. دستورهای چندزبانه که در آن ها نحوهای عینی چندی از روی یک نحو انتزاعی ساخته می شوند، در ایجاد ترجمه های دقیق و حافظ معنا مورد استفاده قرار می-گیرند. از کتابخانه منبع دستوری می توان به عنوان منبعی برای کاربری های پردازش زبان مثل ترجمه، تولید چندزبانه، بومی سازی نرم افزارها و سامانه های گفتاری سود جست. همچنین، این کتابخانه در مطالعات رده شناختی و برای درک آنکه چه مقدار از ساختارهای دستوری می تواند بین زبان های گوناگون مشترک لحاظ گردد، ابزار جالبی در اختیار قرار می دهد. هدف اصلی این پایان نامه، در کنار معرفی چارچوب دستوری و اصول نظری مرتبط با آن، بررسی آن است که چگونه می توان منبعی آزاد برای زبان فارسی در این قالب ایجاد کرد. برای این کار، پس از مشخص کردن پارامترهای مورد نیاز برای مقولات صرفی پایه ای، بخشی از ساختواژه تصریفی و قسمت محدودی از نحو فارسی را در قالب جی اف کد نویسی کردیم. در بخش نتیجه-گیری می بینیم علیرغم آنکه نحو انتزاعی کتابخانه دستوری جی اف جامع نیست، می توان زبان فارسی را تا حد خوبی در آن قالب پیاده سازی کرد؛ اما، از این دستور پیاده سازی شده نمی توان در سامانه های بازیابی اطلاعات و یا سامانه های پرسش و پاسخ، که درونداد آن ها هر متنی می تواند باشد، سود جست.

بازداری در ساختواژه زبان فارسی در چارچوب ساختواژه واژگانی
پایان نامه وزارت علوم، تحقیقات و فناوری - پژوهشگاه علوم انسانی و مطالعات فرهنگی - پژوهشکده زبانشناسی 1390
  مصطفی مهدوی   سید مصطفی عاصی

پژوهش حاضر به بررسی بازداری در ساختواژه زبان فارسی در چارچوب ساختواژه واژگانی می پردازد. بازداری پدیده ای در ساختواژه زبان است که ارتباط نزدیکی با زایایی فرایندهای ساختواژی دارد. زبان شناسان زیادی تاکنون به مسئله زایایی فرایندهای ساختواژی و محدودیت های آنها پرداخته اند و اصطلاح بازداری را برای آن محدودیت ها در نوشته های خود به کار برده اند. هیچ یک از پژوهش هایی که تاکنون در مورد بازداری یا محدودیت های زایایی فرایندهای ساختواژی در زبان فارسی انجام شده است در چارچوب ساختواژه واژگانی نبوده است. البته بحث زایایی و محدودیت های زایایی، که در این پژوهش بازداری نامیده شده است، در زبان فارسی چندان مورد توجه زبان شناسان نبوده و از مباحثی است که به تازگی مورد توجه زبان شناسان در ایران قرار گرفته است. این پژوهش به بررسی محدودیت های زایایی فرایندهای اشتقاقی و تصریفی به عنوان دو فرایند ساختواژی در زبان فارسی با توجه به پدیده بازداری و در قالب نظری? نوین ساختواژ? واژگانی می پردازد که تاکنون از این دیدگاه پژوهشی در قالب مقاله یا پایان نامه انجام نشده است. نگارنده ابتدا داده های مربوطه را از پایگاه داده های زبان فارسی، فرهنگنامه فارسی: واژگان و اعلام صدری افشار و دیگران، و فرهنگ واژه های مصوب فرهنگستان دفترهای اول تا هشتم گردآوری کرده، سپس به بررسی رابطه بازداری میان آن فرایندها در چارچوب نظری یاد شده، پرداخته است. نتایجی که از این پژوهش به دست آمده، بدین قرارند: عواملی که زایایی فرایندها را محدود می کنند عوامل آوایی، ساختواژی، واژگانی و معنایی اند که در مجموع بازداری نامیده می شوند. با بهره گیری از امکانات نظریه ساختواژه واژگانی مانند ترتیب لایه ها، قرارداد حذف قلاب و مفاهیم مرتبط با آن مانند شرط دیگرجایی، ترتیب درونی زمینه چینی و زمینه برچینی و مانند آن می توان بازداری در ساختواژه زبان فارسی را به طور منسجمی بررسی کرد. در نهایت، اینکه بازداری گرایشی عمومی در زبان است که ممکن است تحت تأثیر عواملی مانند برنامه ریزی زبان و یا نیازهای ارتباطی جدید نقض شود. نتایج این پژوهش می تواند در فرهنگ نگاری، دستورنویسی، زبان آموزی و همچنین در زبان شناسی همگانی به کار گرفته شود.

تقطیع نحوی پیکره ی فارسی: رویکردی رایانشی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه علامه طباطبایی - دانشکده ادبیات و زبانهای خارجی 1391
  احسان امجدیان   سید مصطفی عاصی

هدف پژوهش حاضر دست یابی به دستور احتمالی زبان فارسی است. این دستور از نوع دستورهای صوری احتمالی بوده و از دیدگاه رایانشی از نوع دستورهای بافت آزاد واژگانی نشده است. بدیهی است زبان مانند هر پدیده یا رفتار پیچیده ی دیگر نیازمند نظام مولد منسجمی می باشد، که دست یابی به این نظام به منزله ی توانایی تولید و درک، رمزگذاری و رمزگشایی این پدیده است. روشن است نظام تولیدی یک پدیده لزوماً بر نظام خود آن پدیده منطبق نیست، و ممکن است از نظر پیچیدگی و نوع عملکرد بین آن دو تفاوت ها بسیاری وجود داشته باشد. هدف پژوهش حاضر دست یابی به نظام تولید زبان طبیعی در سطح نحو برای زبان فارسی است. در این راستا ابتدا باید مشخص گردد این زبان از چه سطح رایانش پذیری برخوردار است، تا بتوان متناسب با آن نظام تولید آن را طراحی نمود. در این پژوهش تلاش می شود نظام تولیدی نحو زبان فارسی هم گام با آخرین دستاوردها باشد و با گنجاندن نظریه ی احتمالات در نظام محاسباتی خود از پس تبیین آن برآید. تا آن جا که نگارنده اطلاع دارد، پژوهش حاضر اولین کوششی است که به صورت نظام مند در جهت دست یابی به دستور احتمالی بافت آزاد برای زبان فارسی گام بر می دارد. دست یابی به این هدف راه را برای ساختن تقطیع گرهای احتمالی کارآمد هموار می سازد. علاوه بر ساخت تقطیع گرها، دستور مذکور در ترجمه ی ماشینی کاربرد فراوانی دارد و به دقت ترجمه ی حاصل به نحو چشم گیری می افزاید. تحلیل معنایی از جمله ی دیگر حیطه هایی است که نیازمند برونداد دستور مورد نظر است. این دستورها در عامل های مکالمه گر نیز به کار می روند. هدف پژوهش حاضر طراحی دستوری احتمالی با سطح پیچیدگی مناسب برای زبان فارسی است. از این رو نوشته ی حاضر با اتکا به نظریه ی رایانش پذیری که می توان بنیان گذار آن را تورینگ عنوان کرد به کوشش در طبقه بندی زبان فارسی از نظر رایانش پذیری و جایگاه آن در سلسله مراتب چامسکی از دیدگاه نظریه ی سیستم های صوری می پردازد. پرسش های پژوهش: • عملکرد احتمالی سیستم شناختی و زبانی از چه طریقی می تواند در تقطیع نحوی لحاظ گردد؟ • چگونه می توان دستور رایانشی کارآمدی برای زبان فارسی تدوین نمود؟ • دستور رایانشی کارآمد برای زبان فارسی در کدام سطح از سلسله مراتب رایانش پذیری جای می گیرد؟ فرضیه های پژوهش: • با به کار گیری دستورهای صوری احتمالی می توان عملکرد احتمالی سیستم شناختی و زبانی را در تقطیع نحوی لحاظ نمود. • با تکیه بر نظریه ی رایانش پذیری و سیستم های صوری می توان متناظر با سیستم صوری مناسب، دستور رایانشی کارآمدی برای زبان فارسی معماری نمود. • دستور رایانشی کارآمد برای زبان فارسی کافی است در سطح دستورهای بافت آزاد قرار گیرد، و سطح پیچیدگی فراتر از آن مورد نیاز نیست.

دگرگونی معنایی وام واژه های غیر تخصصی فرانسوی در فارسی در پنجاه سال اخیر
پایان نامه وزارت علوم، تحقیقات و فناوری - پژوهشگاه علوم انسانی و مطالعات فرهنگی - پژوهشکده زبانشناسی 1394
  مهدیه میرزااسمعیلی   آزیتا افراشی

در پژوهش پیش ِرو، سعی شده است تا به جنبه های مختلف ورود و حضور وام واژه های غیر تخصصی فرانسوی در زبان فارسی پرداخته شود، که البته در اینبین، موضوع تغییرات معنایی که از بدو ورود وام واژه های فرانسوی به فارسی تا زمان حاضر، در آن ها حادث شده، به عنوان مقوله ی اصلیِ مورد بحث، درنظر گرفته شده است. اگرچه قدمت بسیاری از وام واژه های مورد تحلیل در این پژوهش به بیش از پنجاه سال می رسد، اما با فرض این که روند تغییر معنی آن ها از حدود نیم قرن پیش آغاز شده باشد، بازه ی زمانی پژوهش حاضر، پنجاه سال اخیر درنظر گرفته شده است. اما درکنار موضوع اصلی پژوهش، به چند موضوع جانبی نیز پرداخته شده است؛ از جمله طبقه بندی وام واژه های فرانسوی براساس معیارهای مشخص؛ مانند این که، این واژه ها به چه نسبتی در حوزه ها و طبقات اجتماعی وارد شده اند؟ چه تعداد از این وام واژه ها درطول زمان منسوخ شده اند، و یا درحال منسوخ شدن هستند؟ کدام واژه ها، از زبان های دیگر، و از راه زبان فرانسه وارد فارسی شده اند؟ و چه واژه هایی به قیاس از وام واژه های فرانسوی در فارسی ساخته شده است؟