/******************************************************************
Projectname: Automatic meta Generator
Version: 0.1
Author: saeed arab sheybani
Last modified: دوشنبه ۱۳۸۷/۸/۲۰
ضرورت دارد مورد زیر به این متاژن Ø§ÙØ²ÙˆØ¯Ù‡ شود*
بخشهای ÙØ§Ø±Ø³ÛŒ آمده در آدرس ØµÙØÙ‡ *
شرØ:
برای key
این کلاس بصورت خودکار کلمات کلیدی را از متن استخراج میکند
Ù†ØÙˆÙ‡ استخراج کلمات کلیدی
1- ØØ°Ù کلمات معمول شامل ØØ±ÙˆÙ اضاÙه،ربط Ùˆ Ø§ÙØ¹Ø§Ù„ Ùˆ موارد تعری٠شده(Ùˆ Ùیلتر شده)
2- ØØ°Ù کلمات با ØØ±ÙˆÙ تکراری مانند tehhhfjrl
3- الویت دادن به کلمات از پیش تعری٠شده بدون توجه به ÙØ±Ø§ÙˆØ§Ù†ÛŒ در جمله(کلماتی مانند «آگهی»، «استخدام» Ùˆ....)
4- اعمال برخی موارد هوشمند دیگر(مثلا نادیده Ú¯Ø±ÙØªÙ† کلمات با ÙØ±Ø§ÙˆØ§Ù†ÛŒ بالا Ú©Ù‡ از تعداد ØØ±ÙˆÙ Ú©Ù…ÛŒ با توجه به میزان ÙØ±Ø§ÙˆØ§Ù†ÛŒ در جمله برخوردار هستند
5- در شرایط یکسان از نظر ÙØ±Ø§ÙˆØ§Ù†ÛŒ اولویت دادن به کلمات بزرگتر(با ØØ±ÙˆÙ بیشتر)
Ùˆ کلمات پرمصر٠در زبان ÙØ§Ø±Ø³ÛŒ مانند ØØ±ÙˆÙ ربط Ùˆ اضاÙÙ‡ Ùˆ همچنین Ø§ÙØ¹Ø§Ù„ Ùˆ... را در نظر نمی گیرد
مهمترین ویزگی این متاژن انتخاب کلماتی Ú©Ù‡ ØØªÙ…ا در متن قرار Ú¯Ø±ÙØªÙ‡ میباشد
و برای descroiton
متن مورد نظر را از تگ h انتخاب میکند
Ùˆ در صورت نبودن تگ h از متنهای بولد یا مهم Ø§Ø³ØªÙØ§Ø¯Ù‡ میکند
Change Log:
===========
0.1 Ver یکشنبه ۱۳۸۷/۸/۱۹
Ø§ÙØ²ÙˆØ¯Ù† امکانات بیشتر از جمله قابلیت تشخیص کلمات معمول
================================
0.2 Ver سه شنبه ۱۳۸۷/۸/۲۱
Ø§ÙØ²ÙˆØ¯Ù† استخراج description از متن
=========================================================
از جمله قابلیتهای Ú©Ù‡ میتوان در آینده با این کلاس اضاÙÙ‡ کرد
اتصال به بانک اطلاعاتی برای Ø¯Ø±ÛŒØ§ÙØª کلمات از پیش تعری٠شده
******************************************************************/
|