طراحی جستجو گر

abasfar

Member
سلام من میخوام درباه چگونگی طراحی جستجو گر اطلاعات داشته باشم
منابعی دارید لطف کنید برای بگید
و اگر پروژه هم باشه خیلی ممنون میشم
:shock::cool::green::paint:
 

iLove

Active Member
با سلام .مي توني از خود گوگل كمك بگيري .فقط لازمه كه اسم مبحثت رو تو گوگل سرچ كني!
 
  • Like
Reactions: MDP

abasfar

Member
نه ممنون من نمیخوام ابر جستجوگر یا سوپر جستجوگر طراحی کنم (جستجوگری که از یک یا چند جستجوگر استفاده میکننه)
 

farik

Well-Known Member
با سلام..اول از همه به شما توصیه میکنم برین و چند تا از این اسکریپت های جستجوگر رو بررسی کنین..دوما هم سعی کنین خودتون یکم ابتکار به خرج بدینن باور کنین که تا اقدام نکنین نمیتونین ه نتایج خوبی برسید..در کل همه چیز بستگی به میزانی هوشمندی که میخواین موتورتون داشته باشه داره..
 
  • Like
Reactions: MDP

abasfar

Member
سلام ممنون از جواب شما اما میشه منابع برام مرفعی کنید همون سورس کد رو به صورت پیغام شخصی برام بفرستید
 

abasfar

Member
سلام
دوست عزیز farik ممنون از ارسال شما اما متاسفانه منضور من این نبود چون از گوگل استفاده میکنند و بعد از این php بود بهر حال ممنون از ارسالتان اما متاسفانه دکمه تشکر پیدا نکردم
 

farik

Well-Known Member
با سلام..
تو لینک های ارسالی تا اونجایی که تو توضیحات یکیشون خوندم نوشته بود که سایت ها رو هم ایندکس میکنه...فعلا که من کار دارم اما در اولین فرصت یک موتور که ایندکس کنه واستون میزارم..در ضمن در مورد طرق ایندکس کردن ههم تو انجمن حدود 6 ماه پیش یک بحث مفصل شده..که فکر کنم تو بخش mysql باشه تاپیکش یک سرچ بکنین خالی از لطف نیست..اگه پیدا نکردین میتونین از طریق آدی من که تو اون تاپیک پست دادم پیداش کنین...
موفق باشید..
 

abasfar

Member
ممنون اما من چیزی که کاملا به درد من بخواره پیدا نکردم میشه بیشتر توضیح بدی(asp.net , msql)باشه ممنون میشم
 

farik

Well-Known Member
با سلام..
دوست عزیز طراحی موتور 100% بستگی به درخواست های شما از موتور داره.من asp.net بلد نیستم و پی اچ پی کارم ولی به صورت الگوریتم میگم چیکار باید بکنین...اگه خواستید بگید من نمونه php برای بعضی از موارد دارم براتون بزارم...
شما باید اول یک اسپایدر طراحی کنین..که باز به اختیار خودتون و قدرت سرورتون میتونه هر لینک رو تا چند مرحله دنبال کنه و صفحات رو سیو کنه...سپس در یک فیلد بدون کدهای html و در فیلد دیگه ای با اونها سیو کنه...تا در هنگام جستجو شما به مشکلی برنخورید(این هم اختیاریه میتونین یکی بسازین)..
خوب حالا باید برین سراغ گرفتن رشت جستجو شده..میتونین با استفاده از عبارات منظم کاری کنین که مثلا اگر نتیجه بین " بود دقیقا همون عبارت رو سرچ کنه(اینجاست که اون جدول بدون html به کارتون میاد)و یا میتونین مثلا اگه کاربر از - استفاده کرد بیبینید که عبارت بعدش تو صفحه مورد سرچ نباشهو خیلی کارهای یگه..به هر حال این اون چیزی بود که من میتونستم بگم...خودم یک نمونه کوچیکش رو 2-3 سال پیش برای یکCMS طراحی کردم و خیلی هم خوب کار میکرد ولی چون CMS رو کامل نکردم قول نمیدم اینجا بزارمش...اما روش کلیتا جایی که من میدونم همینه...
یک چیز دیگه هم که میتونی ازش کمک بگیرین اینه که از RSS , ATOM,SiteMap استفاده کنین...که باز نیازمند پارسه کردن xml هستند..برای آپدیت دیتا بیس هم میتونین هر روز یک تعداد خاص از رکورد ها رو به روز رسانی کنین..که به سرور هم فشار نیاد..:rose:
موفق باشید...
 

abasfar

Member
ممنون از جواب شما
اما اگه میشه نمونه صفحه و مقادیر ذخیره سازی که در mysql ذخیره کردیند را بزارید ممنون میشم:green:
 

farik

Well-Known Member
با سلام..من گفتم بهتون مثالی که زدم از یکسری پست ساده تو دیتا بیس استفاده میکرد و مربوط به یک سی ام اس بود..و بانک داده هم مثل بانک های عادی بود...یک سری از این مباحثی که گفتم هنوز وقت نکردم عملی کنم...ولی 100% عملیه:green:
 

abasfar

Member
دوستان خواستم این تاپیک را بالا بیارم تا از تجربه های شما استفاده کنم میشه
در مورد ایندکس کردن صفحات پویا به من اطلاعاتی بدید
 

iLove

Active Member
میتونید این موتور های جستجو رو از سایت هایی مثل اسکریپت.com دانلود فرمایید.
 

abasfar

Member
ممنون دوست عزیز اما من میخوام یاد بگیرم نه اینکه کوپی کنم
و معمولا این الگریتم هایی که در این جستجوگرها استفاده میشن انقدر پیچیده کد نویسی شده اند که نشه الگریتمش را استخراج کرد
 

farik

Well-Known Member
باسلام..
اولا این کهمتوجه نشین رو قبول ندارم..چون هر چی اسکریپت بزرگتر میشه..خودبخود توجه به فرعیات مهمتر میشه که نتیجش پیچیده شدن کده..پس این عمدی نیست..
دوما...کاش یک تاپیک جدید میزدین..و تاپیک قدیمی بالا نمیاوردین...(اخه من چقدر باید شرمنده مدیرا بشم واسه اینکه تو تاپیکای قدیمی بحث میکنم)
سوما..خوب واسه انجام اینکار..شما میاین و هر چی تگ a هست رو با استفاده از DOM یا XML Parser میگیرین و قسمت هایی که ؟ دارن به بعد رو حذف میکنین(چون معمولا اینا ماله کوئری هاست.{نکته: اگه بخواین استاندارد تر باشه باید آدرس رو برید اگه با صفحه ای که تو دیتا بیس داشتین یکسان نبود اونم اضافه کنین به دیتا بیس}..در کل اینطوری شما تو صفحات کرول میکنین..خوب شما میاین آدرس هایی که میخواین بریزین تو دیتابیس رو تو یک جدول میزارین و با CRON OBj (فکر کنم)...اون صفحه رو مثلا هر یکساعت یکبار به روز میکنین..حالا باز خیلی بحثها هم هست که مربوط میشه به معماری جستجوگرتون که مثلا کسی که سایتش رو ثبت میکنه..همینجوری بره دنبال لینکها ..یا نه فقط همون سایت رو ثبت کنه و...
ببخشید اگه گنگ بود..چون الگوریتم بود..منم خیلی خوب توضیح نمیدم معمولا..

موفق باشید
 

abasfar

Member
ممنون از جواب شما دیگه شرمنده :cry: گفتم تاپیک جدید میزنم به من میگم تاپیک ها را جستجو کن
در سری اول و ایندکس کردن مشکلی نیست
سایتی مثل این سایت در نظر میگیریم پس زمان بیشتری برای اپدیت لازم دارد چون باید تمام صفحه ها رو مرور کرد
حالا ما هر صفحه را که مرور میکنیم چون من انجور که متوجه شدم از الگریتم بالا دوباره کلا اطلاعات را بدون در نظر گرفتن تغییر سایت
دوباره اطلاعات را اپدیت میکنه حالا این الگریتم صحیح است به نظر شما مثلا تو دو ساعت کل سایت دانلود و پاک شود تا چه زمانی با چه
ترافیکی قابل انجام است حالا تعداد صفحات سایت ها را بالا ببریم مثلا 50 برابر این سایت
ممنون میشم این الگریتمتان را برای من بیشتر توضیح دهید فکر نکنم درست متوجه شده باشم
پس برای صفحات پویا باید چیکار کنم
 
آخرین ویرایش:

farik

Well-Known Member
باسلام..
خوب اولا برای صفحات پویا معمولا با استفاده از htaccess صفحه رو به شکلی درمیارن که برای موتورهای جستجو و کاربر قابل فهمتر باشه(این یکی از دلایلی است که میگن اینکار تو سئو موثره فکر میکنم)...از طرفی گفتم میتونین صفحه رو باز کنین و با صفحه ای که تو دیتا بیس دارین مقایسه کنین(هر دو صفحه آدرس ها یکیه ولی کوئری ها فرق میکنه)...اگه یکی نبودن صفحه جدید رو هم به دیتا بیس اضافه کنین..
از نظر قابل انجام بودن باید بگم قابل انجام و این یک الگوریتم خیلی ابتدایی برای یک موتور جستجوست ..چون هر کاری هم که بکنین باید ریزه کاری های زیادی رو در موتور جستجوتون در نظر بگیرین...مثلا اینکه هر چند مدت یکبار تغییرات سایت رو آپدیت کنه و...که این موارد هم بستگی به دو تا چیز دارن:1)الگوریتمی که نوشتین 2)قدرت سرورها و پهنای باندتون..
اینکه به طور تقریبی چقدر زمان میبره و.. رو من نمیدونم چون پیادش نکردم..این هم یک ایده تئوری بود که خدمت شما ارائه دادم..
در کل کار شما اینه..
شما یک سایت میگیرین test.com میرین از index شروع میکنین همه لینک ها رو دنبال میکنین اگه قبلا تو دیتا بیس ثبت نشده بود..صفحه رو ذخیره میکنین...حال فقط یک بحث..شما مثلا تو test.com به یک لینک به سایت example org برخورد میکنین..آیا میخواید اون سایت رو هم ایندکس کنین؟..خوب اینجاست که به نظر من میزان قدرت اسکریپت و سرورتون وارد عمل میشه..خودتون باید انتخاب کنین...سیستم رنکینگ هم به خودتون بستگی داره..که باز هم فکر نمیکنم نوشتن یک الگوریتم ساده واسش کاری داشته باشه...البته بازم میگم اینا مباحث نظریه..تو عمل هم چی فرق میکنه...
موفق باشید...
 

جدیدترین ارسال ها

بالا