نام پژوهشگر: محمد تورانداز کناری

طراحی کپچای مقاوم فارسی با استفاده از ویژگی های دستوری زبان فارسی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده برق و کامپیوتر 1393
  محمد تورانداز کناری   فرزین یغمایی

انجام فعالیت¬های روزمره از طریق اینترنت روزبه¬روز درحال افزایش است. لازمه ی انجام این فعالیت ها، تکمیل فرم های ثبت نام و پاسخ به آزمونی موسوم به کپچاست. کپچا آزمونی را تولید می کند که پاسخ به آن برای انسان ها آسان و درعین حال برای برنامه های مخرب بسیار دشوار و یا حتی غیرممکن است. به علت تمایل اکثر کاربران فارسی زبان به استفاده از زبان فارسی برای انجام فعالیت های فوق، طراحی کپچاها به زبان فارسی ضروری است. کپچاهای متنی که تاکنون مورد استفاده قرار گرفته اند، به صورت اعداد، حروف وکلمات انگلیسی بوده اند. اکثر سیستم های کپچای فارسی نیز که اخیرا راه اندازی شده اند، به تولید کلمات به صورت نویزی، محدود شده اند. در این پایان نامه، به بررسی کپچایی مقاوم که با استفاده از ویژگی های دستوری زبان فارسی تولید شده است، پرداخته می شود. در این کپچا که دارای ضریب اطمینان بالایی است، یک جمله ی فارسی با چند خطای دستوری به کاربر نشان داده شده و از او خواسته می شود تا جمله ی صحیح را با توجه به ویژگی های دستوری زبان فارسی وارد نماید. نحوه ی تشکیل نتایج به این صورت است که پایگاه داده ای از کلمات مختلف برای نقش های جمله آماده شده و به صورت تصادفی برای هر نقش، کلمه ای انتخاب می شود. سپس با توجه به نکات دستوری زبان فارسی و با استفاده از این کلمات جمله ای ساخته می شود. این جمله ی صحیح نیز با اعمال تصادفی اشکالات نگارشی، تبدیل به جمله ای می شود که از لحاظ دستور زبان فارسی دچار اشکال می باشد. کاربر، در این کپچا باید جمله ی نشان داده شده را با رفع اشکالات آن به صورت صحیح بنویسد. نتایج حاصل از پیاده سازی این کپچا، نشان می دهد که نوشتن جمله ی صحیح از نظر دستوری به علت نزدیکی به زبان محاوره ای، برای یک کاربر فارسی زبان بسیار آسان بوده و در عین حال یک ماشین کار بسیاردشواری برای حل آن دارد.