خرید اینترنتی کتاب

جستجو در تک بوک با گوگل!

تابعيت پايگاه تك بوك از قوانين جمهوري اسلامي ايران

فرادرس!



چطور!




تبلیغات!


غلبه بر کم رویی

تشبیه شبکه عصبی

امتیاز به این مطلب!

327 views

بازدید

مقدمه:
خلاصه سازی روشی است برای فشرده سازی منتهای  بسیاربزرگ که به دلیل روش بیشترین درمرتبط نرین اطلاعات موجود درمتن استخراج می شودآنچه که مارادراین محدود می نماید استخراج مرتبط ترین اطلاعات وعامل مهم دیگرخواندنی بودن وقابل فهم بودن متن است.
باتوجه به افزایش روزافزون اطلاعات موجود دراینترنت که به صورت الکترونیکی ارائه می شود، تحقیقات وسیعی برروی این زمینه درحال انجام است تابتوان هرچه سریع تر به مرتبط ترین اطلاعات   است یافت مثلاٌ :اگر شما دراینترنت به دنبال موضوعی باشید حجم وسیعی ازصفحات اینترنتی دراختیار شما قرار نی گیرد حال باید تک تک این صفحات رابه طور کامل  مطالعه ؟؟؟؟؟ به اطلاعات موردنیاز دست پیداکنیم . ولی به کمک روشهای خلاصه سازی می توان به راحتی خلاصه یک صفحه اینترنتی رادرچند جمله مشاهده کنید وسپس به به طور خلاصه سازی کلی صورت می پذیرد:
۱-    خلاصه سازی مبتنی برفهم مطلب
۲-    خلاصه سازی مبتنی براستخراج مطالب مهم
روش اول که نام دیگرآن (پرورش طبیعی زبانی) (NLP) می باشد یعنی سعی وآموزش سیستم درفهمیدن متن وباتوجه که قواعد وساختار های زبانی درباره وبایک ساختار جدید تری متن راخلاصه کند دراین روش مانیاز مند گرامر ونحوه جمله نویسی یک زبان خاص هستیم.
قدرت واهمیت این روش دراین است که ازدقت بالاتری برخوردار است ولی به دلیل سرعت پائین وپیچیدگی بسیار زیاد کمتراستفاده می شود.
روش دوم که به روش های آماری معروف هستند ابتدا متن رابه تعداد جملات خود افراد کرده وهر جمله رابایک بردار نگاشت می کنیم که این بردار ها مثال یک سری ویژگی های خاص نظیر تعداد کلمات بعد ویاتعداد اتفاقیی افتادن کلمات کلیدی درآن و… می باشد ازاین روش نیازمند یهای زیادی هستیم تابه یک کلیت ارتمام تنها بوسیله ازاین روش براساس یک سری ویژگی که بردار هرجمله  تشکیل می دهند یادمیگیریم که چ=گونه جملات مزتبط بامفهوم متن راپیدا کنیم.
درسالیان اخیر شاهد حرکتی مستمر ، ازتحقیقا ت صرفاً تئوری به تحقیقات  کاربردی بخصوص درزمینه  پردازش اطلاعات ، برای مسائلی که برای آنه ا راه حلی موجود نیست ویا براحتی قابل حل نیستندبوده ایم. باعنایت به این امر ، علاقه فرازینده ای درتوسعه تئوریک سیستمهای دینامیکی هوشمند که مبتنی برداده ها تجربی هستتند – ایجاد شد ه است شبکه های عصبی مصنوعی جزء این دسته ازسیستمای دینامیکی قراردارند، که باپردازش روی داده ها ی تجربی ، دانش یاقانون نهفته درورای داده ها رابه ساختار شبکه منتقل می کنند. به همین خاطر به این سیستمها هوشمند گویند چراکه براساس محاسبات روی داده ها ی عددی یامثالها، قوانین کلی رافرار می گیرند .این سیستمها درمدلسازی ساختار نرو- سیناتپتیکی مغز باشد.
پیاد ه سازی ویژگیهای شگف انگیز مغز دریک سیستم مصنوعی (سیستم دینامیکی ساخته دست بشر) همیشه وسوسه  انگیز ومطلوب بوده است محققینی که طی سالها در این زمینه فعالیت کرده اند بسیارند؛ لیکن نتیجه ای ن تلاشها ، صرف نظر ازیافته های ارزشمند، باور هرچه بیشتر این اصل بوده اس ت که مغز بشر دست نیافتنی است.
سبکه های عصبی چه دربعد آنالیز وتوسعه ساختاری وچه دربعد پیاده سازی سخت افزار ازنظر کمی وکیفی وتوانایی درحال رشد وپیشرفت می باشد وتکنیکهای مختلف محاسبات عصبی ازلحاظ تعداد همچنان درحال افزایش است فعالیت علمی و کاربردی درمسائل فنی – مهندسی ازقبیل سیستمهای کنترلی ،پردازش سیگنالهاو شناسایی الگو گسترش یافته است. بااذعان بخه این مسائل، دراین بخش قصد داریم به معنای شبکه های عصبی مصنوعی ، حدود انتظارات ماازاین شبکه هاوشباهتهای آنها با شبکه های واقعی بپردازیم.
هنگامی که این جملات رامطالعه می کنید درعمل ازیک سیستم شبکه های عصبی بیولوژیکی پیچیده ، جهت فهم مطالب کتاب می ناییدازمغز به عنوان یک سیستم پردازش اطلاعات باساختار موازی وکاملاً پیچیده که دو درصد وزن بدن راتشکیل می دهد.
وبیش از بیست درصد کل اکسیژن بدن را مصرف می کند برای خواندن، نفس کشیدن ، حرکت، تفکر وتفحص وکلیه اعمال آگاهانه وبسیاری ازرفتارهای ناخودآگاه استفاده می شود. جهت واضح شدن توانائی مغز، یک بازی تنیس رادرنظر بگیرید بازیکن اول به توپ ضربه مزند وتوپ باسرعتی بیش از ۱۳۰کیلومتر درساعت ب ه زمین حریف می رس د حریف مقابل نیز با سرعتی معادل ۶۰ کیلومتر درساعت به توپ ارسالی پاسخ می دهد.تصور نمایید که چه حجم عظیمی ازاطلاعات  وسیگانلها جهت این کار ودرطی زمانی کمتر از چندثانیه بایستی جمع آوری وحاسبه شود. این که چگونه مغز این کارها راانجا م می دهد اززمانی مطرح شد که دریافتند مغز برای محاسبات خود، از ساختاری کاملاً مغایر باساختار متداول برخوردار می باشد.تلاش برای فهم این موضوع خصوصاً ازسال ۱۹۱۱قوت گرفت ، زمانی که برای نخستین بارشخصی به نام سگال اعلام کرد که مغز ازعناصر اصلی ساختاری به نام نرون تشکیل یافته است.
هرنرون بیولوژیکی به عنوان اجتماعی ازموادآلی اگر چه دارای پیچیدگی یک میکروپروسسور می باشد ولی دارای سرعت محاسباتی برابر بایک  میکروپروسسور نیست.
بعضی ازساختارهای نرونی درهنگام تولد ساخته  می شوند وقسمتهای دیگر درطول مسیر حیات ، مخصوصاً دراوایل زندگی به و.جود  می آیند وقوام می گیرند دانشمندان علم بیولوژیکی به تازگی دریافته اند که عملکرد نرونهای بیولوژیکی ازقبیل ذخیره سازی وحفظ بیولوژیکی درخودنرونها  وارتباطات بین نرونها ن هفته است. به عبارت فنی تر ، یادگیری به عنوان ایجاد ارتباطات جدید بین نرونها وتنظیم مجدد ارتباطات موجود استنباط می شود.
اگر چه دانش کمی ازعملکرد نرونها داریم، لیکن سوال این جاست که آیا می توان یک شبکه کوچک تزنرونها ی مصنوعی ساده ساخت، بطوری که جهت حل مسائل پیچیده – که دراصل چیزی جز یادگیری نگاشتها نیست- آموزش پذیر باشد؟ پاسخ مثبت است واین کتاب دراصل جوابی براین مدعاست.
انتظارات
شبکه های عصبی باوجود این که باسیستم عصبی طبیعی قابل مقایسه نیستند ویژگیهایی دارند که آنها رادربعضی ازکابردهایی مانند تفکیک الگو، رباتیک ، کنترل، وبطور کلی درهرجا که نیاز به یادگیری یک نگاشت خطی ویاغیر خطی باشد، ممتاز می نمایند این ویژگیها به شرح زیر هستند:
۱-    قابلیت یادگیری:
استخراج نتایج تحلیلی ازیک نگاشت غیر خطی که باچند مشخص شده، کار ساده ای نیست، زیرا نرون یک دستگا ه غیرخطی است ودرنتیجه یک شبکه عصبی که از اجتماع این نرونها تشکیل می شود نیز یک سیستم کاملاً پیچیده وغیر خطی خواهد بود. به علاوه، خاصیت غیر .خطی عناصر پردازش، ذدرکل شبکه توزیع می گردد. پیاده سازی این نتایج با یک الگوریتم معمولی وبدون قابلی ت یادگیری ، نیاز به دقت ومراقبت زیادی دارد. درچنین حالتی سیستمی که بتواند خود ای ن رابطه رااستخراج کند بسیار سودمند به نظر می رسدخصوصاًافزودن مثالهای احتمالی درآینده به یک سیستم باقابلیت یادگیری ، به مراتب آسانتر ازانجام آن دریک سیستم بدون چنین قابلیتی است، چراکه درسیستم اخیر ، افزودن یک مثال جدید به منزله تعویض کلیه کارهای انجام شده قبلی است.
قابلیت یادگیری یعنی توانایی تنظیم پارامترهای شبکه( وزنهای سیناپتیکی) درمسیرزمانی که محیط شبکه تغییر می کند وشبکه شرایط جدید راتجربه می کند بااین هدف که اگر شبکه برای یک وضعیت خاص آموزش دید وتغییر کوچکی ئرشرایط محیطی آن (وضعیت) رخ داد، شبکه بتواند باآموزش مختصر برای شرایط جدید نیزکارآمد باشد.دیگر این که اطلاعات درشبکه های عصبی درسیناپسها ذخیره می گرددوهرنرون در شبکه، به صورت بالقوه از.کل فعالیت سایر نرونها متأثرمی شود ودرنتیجه ، اطلاعات ازنوع مجزا ازهم نبوده بلکه متأثر ازکل شبکه می باشد.
۲-    پراکندگی اطلاعات پردازش اطلاعات به صورت متن:
آنچه که شبکه فرامی گیرد(اطلاعات یادانش)، دروزنهای سیناپسی مستتر می باشد. رابطه یک به یک بین ورودیها و وزنهای سیناپتیکی وجود ندارد. می توان گفت که هروزن سیناپسی مربوط به همه روریهاست ولی به هیچ یک از آنها بطور منفرد ومجزا مربوط نیست. به عبارت دیگر هرنرون درشبکه ،ازکل فعالیت سایر نرونها متاثر می باشد، در نتیجه ، اطلاعات به صورت متن توسط شبکه های عصبی پردازش می شوند.براین اساس چناچه بخشی ازسلولهای شبکه حذف شوند ویاعملکرد غلط داشته باشندبازهم احتمال رسیدن به پاسخ صحیح وجوددارد.اگر چه ای ن احتمال برای تمام ورودیه ا کاهش یافته ولی برای هیچ یک ازبین نرفته است.
۳-    قابلیت تعمیم:
پس از آنکه مثالهای اولیه به شبکه  آموزش داده شد، شبکه می تواند درمقابف یک ورودی آموزش داده نشده قرارگیرند ویک خروجی مناسب ارائه نمایند.این خروجی بر اساس مکانیسم تعمیم، که همانا چیزی جز فرایند درونیابی نیست به دست می .اید .به عبارت روشنتر ،شبکه ، تابع  رایاد می گیرد، الگوریتم رامی آموزد ویا رابطه تحلیلی مناسبی رابرای تعدادی نقاط درفضا به دست می اورد.
۴-    پردازش موازی:
هنگامی که شبکه   عصبی درقالب سخت افزار پیاده سلولهایی که دریک تراز قرار میگیرند می توانند بطور همزمان به ورودیهای آن تراز پاسخ دهند .این ویژگی باعث افزایش سرعت پردازش می شود .درواقع درچنین سیستمی ،وظیفه کلی پردازش بین پردازنده های کوچکتر مستقل ازیکدیگر توزیع می گردد.
۵-    مقاوم بودن:
دریک شبکه عصبی هرسلول بطور مستقل عمل می کند ورفتار کلی شبکه ، برایند رفتارهای محلی سوللهای متعدد است.این ویژگی باعث می شود تاخطاها ی محلی ازچشم خروجی نهایی دوربمانند.به عبارت دیگر، سلولها دریک روند همکاری ،خطاها ی محلی یکدیگر راتصحیح میکنند. این خصوصیت باعث افزایش قابلیت مقاوم بودن، (تحمل پذیری خطاها) درسیستم می گردد.

 

درروش های آماری براساس شمارش ویژگی های  موردنظر ویادگیری الگوی خلاصه سازی برای هرجمله امتیازی درنظر گرفته می شود وجملات مهم ترکه امتیاز ویادگیری الگوی خلاصه استخراج می شوند.اولین روش یادگیری نظارتی توسط Kupie cetal انجام شد دراین روش ازاحتمال وجود یک جمله رادرخلاصه باتوجه به تصاویر ویژگیهای موردنظرش استخراج میکرد.روش های نظارتی دیگر روزمره درحال تحقیقات گسترده هستند Chauny وبانک الگوریتم های زیادی رابرای جداسازی واستخراج جملات استفاده کردند.
همانطور که ذکرشد هرقاعده شامل یک مقدمه است که ابزارآن توسط عملکردخای AMP ،OR    به هم مربوط ده اند درروش ؟؟؟ ازعملکرد MIN برای amp ازعملکرد MAN برای OR استفاده میکنیم هرقاعده ای که تحت مقدمه آن درجه ؟؟؟؟؟‌داشته باشد فعال می شود بنابراین اگر ازتوابع ؟؟ گاوسی استفاده کنیم توام قواعد فعال خواهدشد اگر ق.اعد نازی توسط عملکردOR به هم مربوط شده باشند برای ترکیب (Aggergation) قواعد  فعال شد ( یعنی بدست آوردن یک خروجی واحد ازروی خروجیهای این قواعد) مالکزیم خروجیهای قواعد رابدست می آوریم.
روش فوق رااستنباح – man – min می نامیم روش دیگر  – ?um – Prod است که درآن ازحزب برای عملکرد AND وازجمع برای عملکرد OR استفاده می آوریم.
مرحله غیر فازی سازی:
درمرحله غیرنازی سازی (Depazzificalion) باتوجه به سطحی که درمرحله استنتاج بدست آمده است.مقداری حقیقی برای خروجی بدست می آوریم روشهای مختلفی برای غیر فارسی سازی وجوددارد که پرکاربردترین آنها روش گرانیگاه (centero f Avermy) است. گرانیگاه سفت کننده سطح میانگین تمام مقادیری بیشترین ؟؟؟عضویت هستند ،کوچکترین مقداری که دارای بیشترین درجه عضویت است. بزرگترین مقداری که دارای بیشترین درجه عضویت است.
در منطق کلاسیک یک عنصر یا متعلق به یک مجموعه هست و یا نیست به عبارت دیگر درجه عضویت هر عنصر در یک مجموعه مفروض یافته است و یا یک اما در منطق فازی درجه عضویت هر عنصر عددی بین صفر و یک است.
دلایل بهره گیری از منطق فازی بیشتر مدول سازی یک سیستم به شدت غیرخطی و بدون داشتن مدل ریاضی است.
مراحل پیاده سازی سیستم فازی:
۱-    مرحله فازی سازی:
مرحله فازی سازی مرحله تعریف مجموعه های فازی برای متغیرهای ورودی و خروجی است برای تعریف این مجموعه های فازی باید دانش اولیه ای از دانه تعریف هر کدام از این متغیرها را داشته باشیم.
اولین مرحله کل فضای ورودی را می توان با توابع خاصی تقسیم بندی کرد. که این توابع عبارتند از:

۲-    مرحله استنتاج:
در مرحله استنتاج، تعدادی قاعده فازی به وجود می آوریم و با استفاده از این قواعد تعداد سیگنال کنترل را با توجه به مقدار خطا و مشتق آن محاسبه می کنیم هر قاعده فازی شامل دو قسمت است یک قسمت مقدم به صورت (اگر …) و یک قسمت نتیجه به صورت (آنگاه ….)

خلاصه سازی با شبکه عصبی:
همان طور که قبلاً گفته شد اولین گام انتخاب ویژگی های مورد نظر است.
در این روش و روش بخش بعدی از این ویژگی ها استفاده می کنیم.
۱-    تعداد تکرار کلمات عنوان از متن
۲-    آیا جمله اول پاراگراف است
۳-    آیا جمله آخر پاراگراف است
۴-    تعداد کلمات در جمله
۵-    تعداد کلمات کلیدی در جمله
۶-    تعداد کلماتی مانند خیلی بیشترین و …
در بخش استخراج ویژگی ها از visual C++(6) استفاده شده است دلایل این کار این است که اولاً با آرایه ها در C بسیار آسان تر از زبان های دیگر است بر سرعت بالای پردازش از Visual c در مقایسه با MATIAB و ویژگی بسیار متمایز و دلیل اصلی این استفاده این بود که چون هدف طراحی یک نرم افزار برای زبان فارسی بود و در این راستا Visual C++ امکانات مناسبتری را به برنامه نویس می داد. هر چند به علت اینکه بقیه کار با MATLAB7 انجام شده بود و فراخوانی این کامپایلر مشکل می شد اما به دلایل نامبرده شده ترجیح داده شد تا از این زبان برنامه نویسی استفاده کنیم.
خروجی این برنامه فایل مطلبی بود که به راحتی سوخت مورد نیاز برای شبکه عصبی که اساس اصلی کار بود را فراهم می نمود.
Baxendale در [ ] بیان داشت که جملاتی که در ابتدا و آخر پاراگراف ها بیان می شود جملات خوبی برای خلاصه هستند و همچنین Baxendale نشان داد که جملات خیلی کوتاه هم اطلاعات مفیدی برای خلاصه ندارند.
ویژگی اول بیان داشت تعداد کلمات عنوان در متن احتمال مربوط بودن به مفهوم متن را افزایش می دهد و در این ویژگی عنوان متن را در یک فایل ذخیره کرده فایل را به صورت آرایه ای خوانده و در جمله متن تعداد کلمات مشابه را پیدا کرده و شمارش می کنیم که این یک ویژگی بسیار مهم است که به استخراج جملات مربوط کمک می کند.

لازم به تذکر است تنها محدودیتی که در این روش وجود دارد ساختار اوست جمله بندی است به عنوان مثال در متن های رسمی پاراگراف با چند فاصله از ابتدای خط آغاز می شود و این تنها ویژگی مشخصه پاراگراف است به این ترتیب پاراگراف ها را پیدا می کنیم و سپس جمله اول هر پاراگراف و جمله آخر آن را به صورت صفر اگر جمله اول نباشد و آخر هم نباشد یک اگر جمله اول باشد دو اگر جمله آخر پاراگراف باشد بیان می داریم همان طور که در مراجع بیان می شود [ ] جملات بسیار کوتاه جملات مناسبی برای ما نیستند. لذا با شمارش تعداد کلمات موجود در متن می توان از آنها نیز پرهیز کرد.

تعداد کلمات کلیدی هم ویژگی بسیار مهمی است، نحوه محاسبه این ویژگی به این گونه است:
ابتدا تمام کلمات اضافه را در فایلی ذخیره می کنیم در متن به دنبال این کلمات می گردیم و آنها را از جمله ها حذف می کنیم حال در متن باقی مانده به شمارش کلمات می پردازیم. کلماتی که بیش از ۱۰ بار (یا هر چند باری که بخواهیم) تکرار شوند را به عنوان کلمات کلیدی استخراج می کنیم که این روش را در مرجع [ ] بیان کرده است.
این یک ویژگی بسیار مهم است زیرا جملاتی که حاوی این کلمات هستند به احتمال زیاد بیشترین ارتباط را با مفهوم متن دارند.
آخرین ویژگی که بیان شده است تعداد کلمات تأکید و تحسین است که باز بیان گر اهمیت این جملات است اینها ویژگی هایی هستند که به نوعی می توان در متن های فارسی نیز استخراج گردد که نحوه این کار را در فصل های آتی بیان می داریم.
در این گزارش و در قسمت شبکه ای عصبی ابتدا شبکه عصبی را با وجود یا عدم وجود جمله در خلاصه آموزش می دهیم و سپس با ارزش وجود جمله در خلاصه به این معنی که جمله i ام با چه ارزشی می تواند در خلاصه قرار داشته باشد.
روش اول با توجه به مقاله k.kaikah [ ] انجام می شود و روش دوم روشی است که در این گزارش معرفی می گردد به منظور آموزش شبکه عصبی از ۱۳۰۰ جمله استفاده شد که جملات را در یک فایل مطلب نگهداری کرده و سپس میزان حضور آنها را در خلاصه بیان داشتیم و شبکه را به این وسیله آموزش دادیم. این یکی از ویژگی های این روش در مقایسه با روش های قبلی است. چون هر خواننده ای می تواند این آموزش را به وسیله سبک و روش خود در خلاصه سازی انجام دهد. تذکر این نکته مهم است که برای هر متن نیازی نیست که کاربر دوباره شبکه را آموزش دهد و تنها یک بار آموزش شبکه کافی است.
در این روش، از روش آموزش مارکوآرت- لونبرگ استفاده کرده ایم که الگوریتم دقیق این کار را بیان خواهیم کرد.
پس از ۲۵۰۰ گام شبکه عصبی به خطای مورد نظر رسیده و کار تمام می شود حال هر متن دلخواه که به عنوان ورودی از کاربر دریافت می کند با کمک این شبکه عصبی آموزش دیده شده خروجی به صورت سفر یعنی جمله خوبی برای خلاصه نیست و یا یک یعنی جمله خوبی برای خلاصه است خواهد بود.
و در روش ما چون آموزش با یک سری عدد بین صفر و یک است و در واقع بیانگر ارزش و وزن هر جمله در خروجی است، خروجی شبکه، قدرت هر جمله را در خلاصه بیان می دارد.
از ویژگی های این روش علاوه بر دقت و دیگر پارامترها می توان به این اشاره کرد که به کاربر اجازه می دهیم تا هر اندازه که می خواهد متن را خلاصه کند مثلاً اگر کاربر می خواهد تا ۲۰% خلاصه کند ۲۰% بالاترین خروجی ها را انتخاب می کنیم و …
برای استخراج خلاصه از روشی که Microsoft office استفاده کرده است بهره گرفتیم به طوری که جملات انتخاب شده را در روی متن اصلی رنگی می کنیم. این کار باعث می شود تا انسجام خلاصه حفظ شده و به نظر کاربر خلاصه خواندنی تر باشد.
نتایج و شبیه سازی:
برای آموزش شبکه عصبی از ۳۰ مقاله خبری با عنوان های مختلف استفاده کردیم که جمعاً ۱۳۰۰ جمله را یک بار برای روش اول یعنی صفر و یک و یک بار برای روش میزان شایستگی آموزش دادیم و نتایج را با Microsoft Word و یک خلاصه ساز دیگر به نام Copernic مقایسه کردیم.
F1, recall , precision رابطه های استانداردی هستند که برای مقایسه استفاده شده است.
J تعداد استخراج ها در خلاصه است و k تعداد جملات انتخاب شده است و M تعداد جملات استخراج شده در متن های آزمون است. لذا (p) Precision به صورت کسری بین j و k به صورت زیر بیان می شود.
  و Recall نیز به صورت   و جمله آخر F1 به صورت   بیان می شود.
هر چند این روابط بسیار مهم و بسیار مناسبی برای مقایسه روش ها می باشد ولی نظر خواننده نیز بسیار مهم است در روش دوم تا ۹۳% جملات استخراجی همان جملاتی بودند که خواننده در آن متن استخراج می کرد.
خلاصه سازی به کمک روش فازی:
همان طور که در دو فصل قبل اشاره شد روش استنتاج فازی نیز روش مؤثر در نگاشت و مدل سازی سیستم های غیرخطی است و ما از قوانین if..then.. فازی و استنتاج فازی در حل این مسئله نیز بهره جستیم و نتایج را با یکدیگر مقایسه می کنیم ابتدا ویژگی های ورودی را به صورت فازی بیان می کنیم و سپس به کمک قوانین فازی به استنتاج فازی می پردازیم در این قسمت برای غیرفازی سازی از روش مرکز جرم استفاده شده است.
ویژگی اصلی حالت فازی این بود که بسیار سریع تر از شبکه عصبی و با دقت بالاتری می توانست متنها را خلاصه سازی کند و این دقیقاً همان چیزی است که از حل این مسئله با فازی انتظار داشتیم.
روش کار به این صورت بود که ابتدا مانند گذشته، ویژی هر جمله را به صورت برداری با اجرا کردن برنامه نوشته شده به زبان C استخراج کرده در یک فایل مطلب ذخیره می کنیم.
این فایل ورودی سیستم استنتاج گر فازی است. سپس به تعریف سیستم فازی می پردازیم و کل فضای ورودی را به توابع عضویت دلخواه که ما در این مسئله از توابع عضویت مثلثی استفاده کردیم افراز می کنیم.
و خروجی را به صورت خلاصه بد خلاصه خوب و خلاصه عالی افراز می کنیم. حال به کمک متغیرهای زبانی به دست آمده شروع به تعریف قوانین فازی که مهم ترین قسمت است می کنیم. اساس این کار همان طور که در بخش شبکه های عصبی به آن اشاره شد قوانین اثبات شده در مقالات گذشته است.
که ما در این قسمت به ۴۰ قانون if then رسیدیم.

 

حال با فراخوانی این FIS در محیط مطلب و دادن متن مورد نظر به عنوان ورودی به FIS می توان خروجی را ملاحظه کرد و با هر دقت مورد نظر جملات را استخراج کرد.
تعریف قوانین در این حالت بسیار مهم است. و این سیستم بهتر می تواند اهداف ما را در این نوع خلاصه برداری بیان کند.
در واقع انگیزه اصلی از حل مسئله با فازی به این صورت روش دوم در شبکه های عصبی بود چون در آن به نوعی مفهوم فازی قرار داشت ولی خود فازی بهتر و دقیق تر می توانست این اهداف را بیان کند.
در این گزارش می خواهیم به کمک روش های مورد مطالعه در بخش محاسبات نرم (Soft Computing) به حل مسئله خلاصه سازی تنها بپردازیم لذا ابتدا به بررسی مختصری درباره شبکه های عصبی و سپس منطق فازی می پردازیم. سپس به کمک شبکه های عصبی به حل این مسئله می پردازیم و سپس با استفاده از منطق فازی این مسئله را حل می کنیم و در بخش بعدی از این دو روش استفاده کرده و تنهایی با زبان های مختلف که بیشترین تأکید، بر روی متنها با زبان فارسی خواهد بود می پردازیم.
روش آموزش پس انتشار خطا با الگوریتم ژنتیک (GA)
برای آموزش ساختار شبکه عصبی لازم است تابع معیار شبکه که در واقع خطای بین مقدار مطلوب و مقدار به دست آمده توسط شبکه عصبی است بر اساس پارامترهای شبکه باید می نیمم شود.
لذا خروجی شبکه عصبی به صورت تابعی از وزنها و بایاسها بیان می شود و سپس به کمک GA می نیمم می گردد در این شبکه عصبی که ما در این گزارش استفاده کردیم با ۴ نود ورودی و ۱۵ نرون لایه میانی و یک نرون خروجی با در نظر گرفتن بایاسها به یک تابع با ۹۰ متغیر برخورد می کنیم.
و ما در یک M فایل شروع به تعریف این خطا کردیم و سپس تابع GA را فراخوانی می کنیم.
با احتمال جهش ۰۱/۰ و احتمال برش ۵/۰ و با ۸ بیت کد کردن GA شروع به می نیمم کردن تابع هدف شد. آنچه که حلقه GA را متوقف می کند تعداد نسلها است. GA با نسل ۱۰۰ام به کار خود ادامه می دهد. مشکلاتی که این الگوریتم دارد سرعت بسیار پائین همگرائی است. در مقایسه با روش مارکوآرت- لونبرگ که در این مسئله سرعت بسیار خوبی داشت، GA واقعاً کند است و زمان مورد نیاز برای پایان الگوریتم با یک Pentum 4 تقریباً ۶ ساعت است.
این سرعت پایین در این مسئله خاص چندان قابل قبول نیست در روش مارکوآرت- لونبرگ ما به خطا   می رسیم که همین دقت برای این مسئله خاص بسیار مناسب است و این در مقایسه سرعتهای همگرائی انتخاب بهتری است.
به عبارت دیگر زمانی که ما این مسئله را با GA حل کردیم و یا با روش مارکوآرت- لونبرگ و یا با هر روش دیگر آموزش جملاتی که جزء خلاصه بودند در تمام این روش ها جزء خلاصه قرار داشتند ولی در این مسئله سرعت همگرائی است که یک روش آموزش را از روش های دیگری برتر می نماید.

روش آموزش پس انتشار خطای مارکوآرت – لونبرگ
الگوریتم آموزشی پس انتشار خطای مارکوآرت – لونبرگ در سال ۱۹۹۴، [HAME94]، جهت آموزش شبکه های عصبی پیشنهاد شد. این روش تقریبی از متد نیوتون می باشد که در ادامه به توضیح آن پرداخته شد ه است.
برای آموزش ساختار شبکه عصبی لازم است تابع معیار شبکه، J، بر اساس پارامترهای شبکه کمینه شود. طبق روش نیوتون، تغییرات پارامترها در هر گام آموزش برابر است با:
 
که در آن   ماتریس هسین و  گرادیان تابعی J نسبت به بردار پارامترهای شبکه،  ، می باشد.
با تعریف تابع معیار شبکه بمانند روابط (۵-۲) و (۳۰-۲)، برابر مجموع مربعات خطا، خواهیم داشت:
                            
 
که در آن   می باشد. P تعداد کل الگوهای آموزشی، و   تعداد خروجی های شبکه است. بنابراین می توان داشت:
 
 
که در آن   عبارت است از:
 
در روش گوس- نیوتن، =۰ فرض می شود و رابطه (۲۸-۲) بصورت (۴۵-۲) درمی آید:

با تصحیح رابطه فئق توسط روش مارکوآرت- لونبرگ، خواهیم داشت:

که در آن   ، ضریب یادگیری مارکوآرت می باشد. هر قدر   کوچکتر انتخاب شود، نحوه آموزش به آموزش گوس- نیوتون نزدیک تر می شود و هر قدر و هر قدر   بزرگتر انتخاب شود، نحوه آموزش مارکوآرت، به آموزش S.D.B.P. نزدیکتر می شود. ضریب آموزشی مارکوآرت،    ، عددی غیرمنفی می باشد.
بردار   دارای ابعاد Pn . 1 است و به صورت زیر انتخاب می شود:

، بردار خطای خروجی، به ازای الگوی ورودی p- ام است.
قدم اساسی در این الگوریتم، محاسبه ماتریس جاکوبین،   ، می باشد. و روند محاسبه     در ماتریس جاکوبین، بمانند آنچه که در بخش آموزش پس انتشار خطای استاندارد گفته شد، انجام می شود، البته با این تفاوت که بجای محاسبه    ، عبارات    محاسبه می شوند.
از محدودیت های روش آموزش مارکوآرت این است که تنها با روند یادگیری Batch قابل استفاده می باشد و هیچ تضمینی ندارد که با آموزش الگو به الگو، همگرا شود. البته از خصوصیات مهم این روش آموزش، سرعت همگرائی فوق العاده آن می باشد. و تا به امروز جزء سریع ترین الگوریتم های آموزشی شناخته شده است.

دانلود کتاب






مطالب مشابه با این مطلب

    ساخت ساده بک گراند ماتریکس در فتوشاپ

    ساخت ساده بک گراند ماتریکس در فتوشاپ / Adobe Photoshop را میتوان بدون شک قدرتمندترین نرم افزار ساخت و ویرایش تصاویر گرافیکی دانست. توانایی هایی که این نرم افزار دارد گاهی شما را به حیرت وا میدارد. حتی ممکن است تصویر گرافیکی را مشاهده […]

    خاموش کردن ویندوز ۱۰ بدون موس

    خاموش کردن ویندوز ۱۰ بدون موس تا به حال به این فکر کرده اید که کامپیوتر خود را بدون موس خاموش، به حالت خواب و یا ری استارت کنید؟! در اینجا می خواهیم میانبرهایی را برای ویندوز ۱۰ معرفی کنیم که آن را خاموش […]

    فعال سازی رمزهای حرفه ای در ویندوز ۱۰

    فعال سازی رمزهای حرفه ای در ویندوز ۱۰ / ویندوز ۱۰، آخرین نسخه از سیستم‌عامل ویندوز است که در طول زمان به‌روزرسانی‌های متعددی برای آن منتشر می‌شود، اما نسخه اصلی آن همچنان روی ۱۰ باقی می‌ماند و احتمالا هیچ نام جدیدی به ویندوز اختصاص […]

    صفر تا ۱۰۰ فتوشاپ

    صفر تا ۱۰۰ فتوشاپ : فتوشاپ نرم افزاری است که غریب به اتفاق مردم از آن استفاده می‌کنند. این نرم افزار همراه با ویژگی‌های پیچیده و قابلیت‌های گسترده‌ای که دارد همواره یکی از مورد استفاده‌ترین برنامه‌ها نزد عکاسان حرفه‌ای دنیا است. بنابر‌این یاد گرفتن […]

    حل مشکل پر شدن درایو C

    شاید برای شما پیش اومده باشه گاهی اوقات درایو C یا حتی درایو های دیگه شما خود به خود پر میشن تا جایی این مشکل پیش میره که دیگه جایی تو درایو c شما باقی نمی مونه و باعث میشه سیستم کند بشه حتی […]

    اجرای برنامه‌ها در دسکتاپ‌های مجازی

    بالاخره مایکروسافت قابلیت ایجاد دسکتاپ‌های مجازی را به‌عنوان یکی از امکانات پیش‌فرض در ویندوز ۱۰ در اختیار کاربران قرار داده و به کمک این قابلیت، مدیریت آسان‌تر و منظم‌تر محیط کاربری ویندوز را برای کاربران فراهم کرده است. تابه‌حال از این قابلیت استفاده کرده‌اید؟ […]




هو الکاتب


پایگاه اینترنتی دانلود رايگان كتاب تك بوك در ستاد ساماندهي سايتهاي ايراني به ثبت رسيده است و  بر طبق قوانین جمهوری اسلامی ایران فعالیت میکند و به هیچ ارگان یا سازمانی وابسته نیست و هر گونه فعالیت غیر اخلاقی و سیاسی در آن ممنوع میباشد.
این پایگاه اینترنتی هیچ مسئولیتی در قبال محتویات کتاب ها و مطالب موجود در سایت نمی پذیرد و محتویات آنها مستقیما به نویسنده آنها مربوط میشود.
در صورت مشاهده کتابی خارج از قوانین در اینجا اعلام کنید تا حذف شود(حتما نام کامل کتاب و دلیل حذف قید شود) ،  درخواستهای سلیقه ای رسیدگی نخواهد شد.
در صورتیکه شما نویسنده یا ناشر یکی از کتاب هایی هستید که به اشتباه در این پایگاه اینترنتی قرار داده شده از اینجا تقاضای حذف کتاب کنید تا بسرعت حذف شود.
كتابخانه رايگان تك كتاب
دانلود كتاب هنر نيست ، خواندن كتاب هنر است.

دانلود کتاب , دانلود کتاب اندروید , کتاب , pdf , دانلود , کتاب آموزش , دانلود رایگان کتاب


تمامی حقوق و مطالب سایت برای تک بوک محفوظ است و هرگونه کپی برداری بدون ذکر منبع ممنوع می باشد.


فید نقشه سایت

تمامی حقوق برای سایت تک بوک محفوظ میباشد