تفکیک کلمات فارسی از سایر کارکتر ها و کلمات?

pix07

Member
سلام دوستان من دنبال یروش برای تشخیص کلمات فارسی از میان یک جمله و جدا کردن اونها هستم برای مثال
یه فایل تکست داریم که شامل دستورات اچ تی ام ال و همچنین کلمات فارسی است چطور میشه بعد از خوندن فایل کلمات فارسی رو توی یه آرایه ریخت یا چطور میشه کلا کلمات رو از دستورات html تفکیک کرد
با تشکر
 

znhost

Member
والا من یه روش دارم. ولی فکر نکنم درست باشه . چون طولانیه.
ابتدا با explode کل متن رو تیکه تیکه میکنی. بعد با پرگ مچ جدا سازیش میکنی. ولی برنامت cpu میسوزونه:green:
دقیق بگو موضوع رو شاید بشه کاریش کرد
 

pix07

Member
با تشکر از شما

در خصوص هدفم باید بیان کنم که :
شاید تا به حال به این نکته توجه کرده باشد که وقتی از امکان جستو جو در تالار گفتمان استفاده میکنید نتایجی رو که بصورت لینک از تاپیک های مختلف به عنوان نتیجه جستوجو معرفی میکنه پس از وروود به تاپیک یا لینک مربوطه کلماتی رو که جستو جو کردیم رو توی متن تاپیک بصورت hilight یا به رنگ های دیگری غیر از رنگ متن مشاهده میکنیم

ضمن این که اگر روشی یا کلاسی برای جداسازی کلمات از دستورات html و یا کلمات لاتین وجود داشته باشه میتوان پس از تفکیک کلمات اونها رو به صورت keyword توی متا meta ریخت و اینجوری seo رو افزاایش داد

znhost جان بله منم همین روش رو به کار گرفته بودم ولی خوب توجه داشته باشید اگه همزمان 20 کاربر وارد سایت شن و هر کدوم 3دسته کم تا مقاله رو باز کنن ..
سرور مستر مارو با احترام اخراج میکنه

PHP:
$keywords=explode('textright',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('style',$keywords);
$keywords=implode(' ',$keywords);

$keywords=explode('textright',$keywords);
$keywords=implode(' ',$keywords);

$keywords=explode('textrightع',$keywords);
$keywords=implode(' ',$keywords);

$keywords=explode('zwnj',$keywords);
$keywords=implode(' ',$keywords);

$keywords=explode('lrm',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('rightsrc',$keywords);
$keywords=implode(' ',$keywords);

$keywords=explode('float',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('asximgframe',$keywords);
$keywords=implode(' ',$keywords);

$keywords=explode('<',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('/',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('>',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('"',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('\'',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('\\',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('.',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('div',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('td',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('br',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('table',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode(':',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode(';',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('fontSizeSmall',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('-',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('class',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('&raquo;',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('&zwnj;',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('=',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('align',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('tr',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('dir',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('rtl',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('_',$keywords);
$keywords=implode(' ',$keywords);
$keywords=explode('  ',$keywords);
$keywords=implode(',',$keywords);
$keywords=explode(' ',$keywords);
$keywords=implode(',',$keywords);
$keywords=explode('&',$keywords);
$keywords=implode(',',$keywords);
$keywords=explode('%',$keywords);
$keywords=implode(',',$keywords);
$keywords=explode('#',$keywords);
$keywords=implode(',',$keywords);
$keywords=explode(('
'),$keywords);
$keywords=implode('',$keywords);
$keywords=explode(',,,,',$keywords);
$keywords=implode('',$keywords);
$keywords=explode(',,,',$keywords);
$keywords=implode('',$keywords);
$keywords=explode(',,',$keywords);
$keywords=implode('',$keywords);
$keywords=explode('p',$keywords);




foreach($keywords as $key){


    echo $key;


}

البته منم این روش رو با سیستم خودم برای یک مقاله یک صفحه ای امتحان کردم
cpu : 1.4 core to solo
ram : 4
cach:3

یچیزی معادل 2.3 ثانیه طول کشید البته که فکر میکنم 0.9 ثانیه مربوط به لود فایل ها و کلا مربوط به گرافیک صفحه و بقیه مربوط به اجرای حلقه ها بود
 
آخرین ویرایش:

greencat

Member
سلام
با یه حلقه ساده for شما می‌تونید این کار رو انجام بدید چون حروف هر زبانی یه کد اصلی داره که همه حروف پشت سر هم هستن برای همین اعدادشون هم توی یه بازه‌ی خواص هستن مثلا اگر درست یادم باشه کاراکتر a کدش 42 یا 62 بودش (دقیق یادم نیستش) حالا شما تک تک کاراکتر‌ها رو چک می‌کنید که توی متنتون هستش حتی اگر 10000 کلمه هم باشه انچنان زمانی نمیبره در حد چند ثانیه هستش.
 

جدیدترین ارسال ها

بالا