پرش به محتوا

وراثت چامسکی

از ویکی‌پدیا، دانشنامهٔ آزاد

وراثت چامسکی یا سلسله‌مراتب چامسکی یا سلسله‌مراتب چامسکی-شوتزنبرگر (به انگلیسی: Chomsky hierarchy) در زمینه‌های علوم کامپیوتر و زبان‌شناسی، به خصوص در زمینهٔ زبان‌های صوری، یک سلسله مراتب نگهدارندهٔ کلاس‌های دستور زبان صوری است. سلسله‌مراتب گرامرها توسط نوآم چامسکی در سال ۱۹۵۶ توصیف شده است. در نام گذاری این سلسله مراتب، از اسم مارسل-پل شوتزنبرگر (به انگلیسی: Marcel-Paul Schützenberger) نیز به پاس نقش اساسی وی در توسعهٔ نظریهٔ زبان‌های رسمی (زبان صوری)، استفاده شده است. سلسله‌مراتب چامسکی در اصل امکان درک و بکارگیری مدل علوم کامپیوتر را فراهم می‌کند. این مدل به برنامه‌نویس‌ها اجازه می‌دهد که اهداف زبان‌شناسی مفهوم‌دار را به صورت سیستماتیک به انجام برسانند.

دستور زبان‌های رسمی (صوری)

[ویرایش]
مقالهٔ اصلی: دستور زبان صوری

دستور زبانی رسمی از این نوع، از یک مجموعه‌ای متناهی از قواعد تولید تشکیل شده است (سمت چپ سمت راست) که هر سمت آن، خود شامل رشته‌ای از نمادهای زیر می‌باشد:

  • مجموعه‌ای متناهی از نمادهای ناپایانه (که نشان‌دهندهٔ این است که هنوز برخی از قواعد تولید را می‌توان اعمال نمود)
  • مجموعه‌ای متناهی از نمادهای پایانه (که نشان‌دهندهٔ این است که هیچ قاعدهٔ تولیدی را نمی‌توان اعمال نمود)
  • یک نماد آغازین (یک نماد ناپایانهٔ متمایز)

گرامر رسمی یک زبان رسمی را تعریف (یا تولید) می‌کند، که مجموعه‌ای (معمولاً متناهی) از رشته‌هایی با طول متناهی از نمادها هستند، که ممکن است با اعمال قواعد تولید به رشته‌ای دیگر از نمادها که از ابتدا فقط حاوی نماد آغازین بوده‌اند، ساخته شوند. یک قاعده می‌تواند با جایگزین کردن یک رخداد از نمادها در سمت چپ قاعده با رخدادی که در سمت راست ظاهر می‌شود، به رشته‌ای از نمادها اعمال شود. رشته‌ای از کاربردهای قاعده را «اشتقاق» می‌خوانند. چنین گرامری زبان رسمی را تعریف می‌کند: همهٔ واژه‌هایی که تنها از نمادهای پایانه‌ای تشکیل شده باشند که با اشتقاقی از نماد آغازین، قابل دسترسی باشند. ناپایانهها معمولاً با حروف بزرگ، پایانه‌ها با حروف کوچک، و نماد آغازین با نمایش داده می‌شوند، مثلاً گرامری با پایانه‌های ، ناپایانه‌های ، قواعد تولید:

ε (where ε is the empty string)

و نماد آغازین ، زبان همهٔ واژه‌هایی با شکل را تعریف می‌کند (یعنی نسخه از و به دنبال آن کپی از ). مورد بعدی گرامر ساده‌تری است که زبان مشابهی را تعریف می‌کند: پایانه‌های ، ناپایانهٔ ، نماد آغازین ، قواعد تولید

ε

به عنوان مثالی دیگر، گرامری برای یک زیرمجموعهٔ سرگرمی از زبان انگلیسی، به صورت زیر داده شده است: پایانه‌های ، ناپایانه‌های ، قواعد تولید

و نماد آغازین . مثالی از اشتقاق این است:

SENTENCE NOUNPHRASE VERBPHRASE ADJ NOUNPHRASE VERBPHRASE ADJ NOUN VERBPHRASE ADJ NOUN VERB NOUNPHRASE ADJ NOUN VERB ADJ NOUNPHRASE ADJ NOUN VERB ADJ ADJ NOUNPHRASE ADJ NOUN VERB ADJ ADJ NOUN great NOUN VERB ADJ ADJ NOUN great linguists VERB ADJ ADJ NOUN great linguists generate ADJ ADJ NOUN great linguists generate great ADJ NOUN great linguists generate great green NOUN great linguists generate great green ideas.

سایر رشته‌هایی که می‌توانند از این گرامر مشتق شوند "ideas hate greate linguists" و "ideas generate" هستند. این جملات بی‌معنی هستند، اما از لحاظ ساختاری صحیحند. جمله‌ای که از لحاظ ساختاری نادرست باشد، مثل "ideas ideas great hate"، نمی‌تواند از گرامر مشتق شود. به عنوان مثالی مشابه، “Colorless green ideas sleep furiously” از چامسکی در سال ۱۹۵۷ را ببینید؛ برای یافتن مثال‌های زبانی طبیعی‌تر و مسائل گرامرهای رسمی در این زمینه، بخش‌های گرامر ساختار عبارت و قواعد ساختار عبارت را ببینید.

وراثت

[ویرایش]

سلسه مراتب چامسکی شامل سطح‌های زیر است؛

  • گرامر نوع صفر (گرامر نامحدود) شامل تمام گرامرهای رسمی است. آن‌ها تمامی زبان‌هایی که به عنوان ماشین تورینگ شناخته می‌شوند را تولید می‌کنند. این زبان‌ها همچنین به عنوان زبان شمارش پذیر بازگشتی هم شناخته شده‌اند. لازم است ذکر شود که با زبان بازگشتی که با تورینگ ماشین همیشه ایستا تشخیص داده می‌شود، متفاوت است.
  • گرامر نوع اول (گرامر حساس به متن) گرامر حساس به متن را تولید می‌کند. این گرامرها قوانینی به صورت با غیر پایانه و ، و رشته‌ای از پایانه‌ها یا\و غیر پایانه‌ها است. رشته‌های و ممکن است تهی باشند ولی نمی‌تواند تهی باشد. قانون مجاز است اگر S در سمت راست هیچ‌کدام از قوانین ظاهر نشود. زبانهای توصیف شده با این گرامر، دقیقاً زبانهایی هستند که بعنوان آتاماتای خطی کران‌دار شناخته می‌شوند(ماشین تورینگ غیر قطعی ای که نوار آن به وسیله زمان ثابت طول ورودی آن کران دار است)
  • گرامر نوع دوم(گرامر مستقل از متن) گرامر مستقل از متن را تولید می‌کند. اینها با قوانینی به فرم با غیر پایانه و رشته‌ای از پایانه‌ها یا\و غیر پایانه‌ها است. این زبانها همان‌هایی هستند که به عنوان اتوماتون پشته‌ای غیرقطعی شناخته می‌شوند. گرامر مستقل از متن - یا ترجیحاًٰ زیر مجموعه زبان مستقل از متن قطعی - پایه تئوری برای ساخت عبارتی بیشتر زبان‌های برنامه‌نویسی است، اگرچه گرامر آن‌ها شامل تبدیل نام به آدرس حساس به متن بر طبق اعلام‌ها و طرح نهایی است. اغلب یک زیر مجموعه از گرامرها برای راحت تجزیه کردن استفاده می‌شود، مانند یک تجزیه‌کنندهٔ ال‌ال.
  • گرامر نوع سوم (دستور زبان منظم) گرامر منظم را تولید می‌کند. چنین گرامری قوانین محدود به یک غیر پایانه در سمت چپ و یک ترمینال در سمت راست دارد، احتمالاً به دنبال یک غیر پایانه (راست منظم). متناوباً، سمت راست گرامر می‌تواند شامل یک پایانه باشد، احتمالاً قبل از یک غیر پایانه (چپ منظم)؛ این همان زبان را تولید می‌کند - اگر چه، اگر قوانین چپ و قوانین راست به طور منظم با هم ترکیب شوند، زبان نیازی ندارد منظم باشد. قانون مجاز است اگر در سمت راست هیچ‌کدام از قوانین ظاهر نشود. زبانهای توصیف شده با این گرامر، دقیقاً زبانهایی هستند که بعنوان ماشین حالات متناهی تصمیم‌گیری می‌شوند. علاوه بر این، این خانواده از زبان‌های رسمی را می‌توان به وسیله عبارت باقاعده به دست آورد.

توجه داشته باشید که مجموعه گرامرهای متناظر با زبان‌های بازگشتی عضو این سلسله مراتب نمی‌باشد؛ می‌تواند به درستی بین نوع صفر و نوع اول باشد.

هر زبان به طور منظم مستقل از متن است، هر زبان مستقل از متن (شامل رشته تهی نباشد) حساس به متن است، هر زبان حساس به متن بازگشتی است و هر زبان بازگشتی به صورت بازگشتی شمارش پذیر است. این شمول‌ها مناسب همه هستند، به این معنی که زبان‌های شمارش پذیر بازگشتی ای وجود دارند که حساس به متن نیستند، زبان‌های حساس به متن ای که مستقل از متن نیست و زبان‌های مستقل از متن که منظم نیست.

خلاصه

[ویرایش]

جدول زیر خلاصه هر یک از چهار نوع چامسکی از گرامرها، کلاسی که آن زبان تولید می‌کند، نوع اتوماتی که تشخیص می‌دهد و شکل قوانینی که دارد است.

دستور زبان زبان خودکارسازی قاعدهٔ تولید
نوع صفر زبان شمارش‌پذیر بازگشتی ماشین تورینگ (no restrictions)
نوع اول حساس به متن آتاماتای خطی کران‌دار
نوع دوم مستقل از متن اتوماتون پشته‌ای
نوع سوم زبان منظم ماشین حالات متناهی
و

منابع

[ویرایش]
  • «Chomsky.info». The Noam Chomsky website. بایگانی‌شده از اصلی در ۱۳ سپتامبر ۲۰۱۸. دریافت‌شده در تیرماه ۱۳۸۷. تاریخ وارد شده در |تاریخ بازدید= را بررسی کنید (کمک)
  • «The Chomsky Hierarchy». National University of Ireland, Maynooth. بایگانی‌شده از اصلی در ۲۳ نوامبر ۲۰۰۷. دریافت‌شده در ۳ تیر ۱۳۸۷.
  • https://web.archive.org/web/20080317131322/http://coral.lili.uni-bielefeld.de/Classes/Winter97/IntroCompPhon/compphon/node66.html
  • http://www.staff.ncl.ac.uk/hermann.moisl/ell236/lecture5.htm
  • Chomsky hierarchy. (2008, June 18). In Wikipedia, The Free Encyclopedia. Retrieved 18:30, July 3, 2008, from http://en.wikipedia.org/w/index.php?title=Chomsky_hierarchy&oldid=220223801
  • Chomsky, Noam (1959). "On certain formal properties of grammars" (PDF). Information and Control. 2 (2): 137–167. doi:10.1016/S0019-9958(59)90362-6. Archived from the original (PDF) on 23 September 2015. Retrieved 27 June 2015.
  • Chomsky, Noam; Schützenberger, Marcel P. (1963). "The algebraic theory of context free languages". In Braffort, P.; Hirschberg, D. (eds.). Computer Programming and Formal Languages. Amsterdam: North Holland. pp. 118–161.
  • Davis, Martin D.; Sigal, Ron; Weyuker, Elaine J. (1994). Computability, Complexity, and Languages: Fundamentals of Theoretical Computer Science (2nd ed.). Boston: Academic Press, Harcourt, Brace. p. 327. ISBN 0-12-206382-1.

پیوند به بیرون

[ویرایش]