mansoury
New Member
امروزه اينترنت به صورت منبع اطلاعاتی کاملی در آمده است که روز به روز کامل تر می گردد و تقريبا درباره هر چيزی می توان در آن خواند. در اين دنيای اطلاعات که از هر گوشه دنيا به آن متصل می شوند و هر کس بنا به نياز خود اطلاعات لازم را دريافت می کند، پيدا کردن سريع اطلاعات مورد نياز به صورت يک فن در آمده است که هر کس مسلط بر آن باشد سريع تر و راحت تر به اطلاعات مورد نياز خود دست می يابد.
در اين بين سايتهايی هستند که خدمات جستجو در ميان انبوه اطلاعات را ارائه می دهند. در اين مقاله سعی شده است نحوه کار با اين سايتها بيان گردد.
Search Tool ها، سايت هايي هستند که توسط برنامه هاي نوشته شده برايشان به جستجو در Web هاي ثبت شده در DataBase هايشان مي پردازند. حالا اين وب هاي ثبت شده ميتوانند فقط مربوط به يک سايت باشند و يا ميتوانند صفحات وب سايت هاي زيادي را در بر بگيرند. Search Tool صرفا براي جستجوي صفحات وب نيست، مثلا ميتونين از سايت هاي خريد و فروش و حراج اينترنتي جنس خودتون رو جستجو کنين .
انواع Search Tool ها:
چهار نوع Search Tool در اينترنت وجود داره (اين رو اضافه کنم که اين طبقه بندي مال زمان دختر بازي پدر بزرگ خدا بيامرز بنده هست):
1. Directory Search Tools
2. Search Engine Tool
3. Directory With Search Engine
4. Multi-Engine Search Tool (Meta-Search)
Directory Search Tools:
بانک اطلاعاتي اينگونه سايت ها امکان جستجو بر اساس Keyword رو نداره، ولي بر اساس موضوع ميتونيم به سايت هاي مورد نظر دست پيدا کنيم. مثلا براي پيدا کردن سايت شخصي فلان خواننده اول بايد به بخش Entertainment و بعد بخش Music، بعد بخش Artists بريم و بعد اسم خواننده رو انتخاب کنيم.
همونطوري که مشخصه با استفاده از يه موضوع عمومي و مراحل قدم به قدم ميشه به مقصود رسيد. مزيت اين روش اينه که خيلي ساده س، ولي بسيار وقت گيره!
Search Engine Tool:
بر خلاف نوع قبلي از Search Engine ها، فقط در صورتي ميشه استفاده کرد که کليدواژه، همون Keyword خودمون، رو بدونيم.
مثلا اگه دنبال يه سايت براي Ronaldo ميگرديم، بايد به عنوان Keyword کلمه Ronaldo رو وارد کنيم. و ليست سايت هاي مربوطه رو بر اساس تعداد Hits دريافت ميکنيم. البته بعضي مواقع جنبه هاي تجاري سايت ها باعث ميشه به عنوان مثال سايتي که Hits کمتري داره، در ليست بالاتر از سايت هاي ديگر نشون داده بشه. اين روش خيلي سريع تشريف داره!
Directory With Search Engine:
همونطور که از اسم اين مدل مشخصه، تلفيقي از دو نوع بالاست. يعني هم طبقه بندي موضوعي داره، هم قابليت استفاده از Keyword داره. فرقش با روش قبلي اينه که از Keyword علاوه بر جستجو در وب هاي ثبت شده در بانک اطلاعاتيش، روي موضوع هاي Directory ها هم جستجو ميکنه.
الان ديگه اکثر Search Engine هاي معروف به اين صورت هستن. نمونه واضحش که خجالت ميکشم بگم Yahoo.com خودمونه که البته Directory ها رو با عنوان Categories هم معرفي کرده.
Multi-Engine Search Tool يا Meta-Search:
اين يکي هم همون بالايي هستش، منتها فرقش اينه که براي جستجو از بانک اطلاعاتي سايت هاي ديگه مثل Yahoo و Google و Lycos و AltaVista و ... همزمان استفاده ميکنه.
يکي از معروفترين اين نوع Search Tool ها سايت MetaCrawler.com هست .
الان به طور کلي از نوع سوم و چهارم استفاده خيلي زيادي ميشه.
روش هاي جستجو در Search Engineها
اغلب Search Engineها براي جستجوي Keywordها از يه سري Operator يا به اصطلاح عملگر استفاده ميکنن. اينجا براي مثال و اين حرفا از Yahoo استفاده ميکنيم.
پنج نوع Operator داريم:
1. Boolean
2. Plus / Minus
3. Phrases
4. Stemming
5. Case Sensitive
اول يه تعريف از عبارت بکنم. هر موقع ما چندتا کليدواژه رو بين " " قرار بديم، يه عبارت داريم. مثلا "david
beckham" يه عبارته. وقتي ما يه عبارت رو به يه Search Engine براي جستجو بديم، صفحاتي رو برامون پيدا ميکنه که ترتيب کلمات عبارت رعايت شده باشن. يعني فقط صفحاتي رو پيدا ميکنه که کليدواژه david حتما قبل از کليدواژه beckham قرار داشته باشه. همين الان توي يه Search Engine يه عبارت رو جستجو کنين تا گوشي بياد دستتون.
Boolean:
شامل عملگرهاي AND, OR براي متصل کردن Keywordها و عبارات
AND: اين Operator به برنامه جستجو ميگه که صفحات وبي رو براي ما بياره که شامل عبارت و يا کلمه قبل و بعد AND باشن.
مثلا اگه تو ياهو اين عبارت رو سرچ کنين ali AND mamad ، صفحاتي رو براي شما مياره که حتما حتما دو کلمه ali و mamad رو شامل باشن. يا مثلا ali AND mamad AND reza فقط صفحاتي رو مشخص ميکنه که هر سه کلمه رو شامل باشن. به خاطر همين، استفاده از عملگر AND باعث ميشه که به جواب هايي برسيم که به مقصودمون نزديک تر هستن.
OR: همونطور که از اسمش معلومه، باعث ميشه که صفحاتي نشون داده بشن که حداقل يکي از Keywordها يا عبارت ها رو شامل باشن. مثلا ali OR mamad صفحاتي رو نشون ميده که يا ali داشته باشن، يا mamad يا هر دو Keyword رو داشته باشن.
يه مثال ديگه. فکر ميکنين معني اين چي باشه؟ ali OR mamad AND reza. به زبون فارسي ميشه صفحاتي که يا ali داشته باشن يا mamad يا هر دوشون رو و حتما reza داشته باشن . ولي معني اين جستجو فرق داره ali OR "mamad AND reza". معني اين جستجو اين ميشه: صفحاتي رو پيدا کن که يا ali رو داشته باشه، يا mamad و reza رو. يعني امکان نداره که به شما صفحه رو معرفي کنه که فقط شامل ali و reza باشه. صفحه هايي که معرفي ميشن يا ali رو دارن، يا جفت mamad و reza رو دارن، يا هر سه تا رو شامل ميشن! يه چيزي تو همون مايه هاي جبر مجموعه هاي درس جبره!
يعني بخوايم جبري بگيم ميشه ali اشتراک (mamad اجتماع reza)
) خيلي خنده دار شد. بيخيال اينجا رو فراموش کنين.
عملگرهاي بولين بيشتر از اينا هستن، ولي جديدا منسوخ شدن و ازشون استفاده نميشه. مثلا NOT, XOR و NEAR. به اين نکته هم توجه داشته باشين که بعضي از Search Engineها اين عملگرها رو فقط با حروف بزرگ ميشناسن .
Plus / Minus:
تو اين روش همونطوري که از اسمش معلومه از علامت هاي + و - استفاده ميشه.
+: از اين عملگر، دقيقا مثل عملگر AND استفاده ميکنن. يعني "ali"+"mamad" دقيقا کار ali AND mamad رو انجام ميده .
-: اين عملگر باعث ميشه که صفحاتي نشون داده بشين که شامل Keyword اولي باشن ولي Keyword دومي رو نداشته باشن. مشابه NOT در عملگرهاي Boolean. مثلا "ali"-"mamad" صفحاتي رو شامل ميشه که ali رو داشته باشن ولي به هيچ وجه mamad رو نداشته باشن. اين عملگر هم باعث ميشه که مثل + و AND به نتايج کمتر ولي دقيق تري برسيم.
مسئله اي که هست اينه که براي اين روش حتما بايد Keywordها رو بين " " قرار بديم. يه نکته هم که هست اينه که اغلب بايد هيچ گونه Spaceي خارج از گيومه استفاده نکنيم. مثلا اين جستجو غلطه "ali" + "mamad" ولي اين يکي درسته "david beckham"+"ali"
Phrases:
عبارت رو بالا توضيح دادم، ولي يه بار ديگه ميگم. هر موقع که چند تا کليدواژه رو بين " " قرار بديم يه عبارت ساختيم. يعني مثلا نتيچه جستجوي "ali mamad" صفحاتي است که دو کلمه ali و mamad رو دقيقا کنار هم داشته باشه و ali مقدم بر mamad باشه. اين عملگر مشابه عملگر NEAR بولين هستش.
Stemming:
براي امتحان کردن اين روش جستجو، من سايت InfoSeek.Go.Com رو پيشنهاد ميکنم.
پايه و اساس اين روش استفاده از کاراکتر * است. يعني مثلا اگه ما در InfoSeek براي Stream* جستجو کنيم، چند کليدواژه از طرف خود سايت در نظر گرفته ميشه که همه شون با کلمه Stream شروع ميشن. مثلا Stream, Streaming, Streamline, Streamer و ...
Case Sensitive:
و بالاخره مورد آخر رو بعضي سايت ها مثل Yahoo ساپورت ميکنن. از اسم اين روش هم مشخصه که اينگونه جستجوها به کوچک و بزرگ بودن حروف Keyword حساسيت نشون ميده.
مثلا David Beckham, Roberto Carlos دقيقا کار "David Beckham"+"Roberto Carlos" رو انجام ميده. ولي خب خيلي راحت تره. مخصوصا اينکه ميشه با يه کاما عبارت رو از هم جدا کرد. منتها اين رو بگم که اين مورد براي جستجوي افراد مشهور کاربرد زيادي داره.
خب ديگه، حالا با استفاده از اين روش ها خيلي راحت تر ميتونين در اينترنت، در هر سايتي که امکان جستجو داره، به کندوکار بپردازيد. البته اين روزا اکثرا يه قسمتي رو Search Engineها با نام Advanced Search ميبينيم که با چند تا سوال از ما دقيقا همين کارهاي بالا رو انجام ميده. منتها پشت صحنه رو ما نميبينيم. با اينکه راحتي کاربرا يکي از سياست هاي اينطور سايت هاست، ولي به نظر من استفاده دستي از اين کدها خيلي راحتتر از استفاده از صفحه Advanced Serachه!
در اين بين سايتهايی هستند که خدمات جستجو در ميان انبوه اطلاعات را ارائه می دهند. در اين مقاله سعی شده است نحوه کار با اين سايتها بيان گردد.
Search Tool ها، سايت هايي هستند که توسط برنامه هاي نوشته شده برايشان به جستجو در Web هاي ثبت شده در DataBase هايشان مي پردازند. حالا اين وب هاي ثبت شده ميتوانند فقط مربوط به يک سايت باشند و يا ميتوانند صفحات وب سايت هاي زيادي را در بر بگيرند. Search Tool صرفا براي جستجوي صفحات وب نيست، مثلا ميتونين از سايت هاي خريد و فروش و حراج اينترنتي جنس خودتون رو جستجو کنين .
انواع Search Tool ها:
چهار نوع Search Tool در اينترنت وجود داره (اين رو اضافه کنم که اين طبقه بندي مال زمان دختر بازي پدر بزرگ خدا بيامرز بنده هست):
1. Directory Search Tools
2. Search Engine Tool
3. Directory With Search Engine
4. Multi-Engine Search Tool (Meta-Search)
Directory Search Tools:
بانک اطلاعاتي اينگونه سايت ها امکان جستجو بر اساس Keyword رو نداره، ولي بر اساس موضوع ميتونيم به سايت هاي مورد نظر دست پيدا کنيم. مثلا براي پيدا کردن سايت شخصي فلان خواننده اول بايد به بخش Entertainment و بعد بخش Music، بعد بخش Artists بريم و بعد اسم خواننده رو انتخاب کنيم.
همونطوري که مشخصه با استفاده از يه موضوع عمومي و مراحل قدم به قدم ميشه به مقصود رسيد. مزيت اين روش اينه که خيلي ساده س، ولي بسيار وقت گيره!
Search Engine Tool:
بر خلاف نوع قبلي از Search Engine ها، فقط در صورتي ميشه استفاده کرد که کليدواژه، همون Keyword خودمون، رو بدونيم.
مثلا اگه دنبال يه سايت براي Ronaldo ميگرديم، بايد به عنوان Keyword کلمه Ronaldo رو وارد کنيم. و ليست سايت هاي مربوطه رو بر اساس تعداد Hits دريافت ميکنيم. البته بعضي مواقع جنبه هاي تجاري سايت ها باعث ميشه به عنوان مثال سايتي که Hits کمتري داره، در ليست بالاتر از سايت هاي ديگر نشون داده بشه. اين روش خيلي سريع تشريف داره!
Directory With Search Engine:
همونطور که از اسم اين مدل مشخصه، تلفيقي از دو نوع بالاست. يعني هم طبقه بندي موضوعي داره، هم قابليت استفاده از Keyword داره. فرقش با روش قبلي اينه که از Keyword علاوه بر جستجو در وب هاي ثبت شده در بانک اطلاعاتيش، روي موضوع هاي Directory ها هم جستجو ميکنه.
الان ديگه اکثر Search Engine هاي معروف به اين صورت هستن. نمونه واضحش که خجالت ميکشم بگم Yahoo.com خودمونه که البته Directory ها رو با عنوان Categories هم معرفي کرده.
Multi-Engine Search Tool يا Meta-Search:
اين يکي هم همون بالايي هستش، منتها فرقش اينه که براي جستجو از بانک اطلاعاتي سايت هاي ديگه مثل Yahoo و Google و Lycos و AltaVista و ... همزمان استفاده ميکنه.
يکي از معروفترين اين نوع Search Tool ها سايت MetaCrawler.com هست .
الان به طور کلي از نوع سوم و چهارم استفاده خيلي زيادي ميشه.
روش هاي جستجو در Search Engineها
اغلب Search Engineها براي جستجوي Keywordها از يه سري Operator يا به اصطلاح عملگر استفاده ميکنن. اينجا براي مثال و اين حرفا از Yahoo استفاده ميکنيم.
پنج نوع Operator داريم:
1. Boolean
2. Plus / Minus
3. Phrases
4. Stemming
5. Case Sensitive
اول يه تعريف از عبارت بکنم. هر موقع ما چندتا کليدواژه رو بين " " قرار بديم، يه عبارت داريم. مثلا "david
beckham" يه عبارته. وقتي ما يه عبارت رو به يه Search Engine براي جستجو بديم، صفحاتي رو برامون پيدا ميکنه که ترتيب کلمات عبارت رعايت شده باشن. يعني فقط صفحاتي رو پيدا ميکنه که کليدواژه david حتما قبل از کليدواژه beckham قرار داشته باشه. همين الان توي يه Search Engine يه عبارت رو جستجو کنين تا گوشي بياد دستتون.
Boolean:
شامل عملگرهاي AND, OR براي متصل کردن Keywordها و عبارات
AND: اين Operator به برنامه جستجو ميگه که صفحات وبي رو براي ما بياره که شامل عبارت و يا کلمه قبل و بعد AND باشن.
مثلا اگه تو ياهو اين عبارت رو سرچ کنين ali AND mamad ، صفحاتي رو براي شما مياره که حتما حتما دو کلمه ali و mamad رو شامل باشن. يا مثلا ali AND mamad AND reza فقط صفحاتي رو مشخص ميکنه که هر سه کلمه رو شامل باشن. به خاطر همين، استفاده از عملگر AND باعث ميشه که به جواب هايي برسيم که به مقصودمون نزديک تر هستن.
OR: همونطور که از اسمش معلومه، باعث ميشه که صفحاتي نشون داده بشن که حداقل يکي از Keywordها يا عبارت ها رو شامل باشن. مثلا ali OR mamad صفحاتي رو نشون ميده که يا ali داشته باشن، يا mamad يا هر دو Keyword رو داشته باشن.
يه مثال ديگه. فکر ميکنين معني اين چي باشه؟ ali OR mamad AND reza. به زبون فارسي ميشه صفحاتي که يا ali داشته باشن يا mamad يا هر دوشون رو و حتما reza داشته باشن . ولي معني اين جستجو فرق داره ali OR "mamad AND reza". معني اين جستجو اين ميشه: صفحاتي رو پيدا کن که يا ali رو داشته باشه، يا mamad و reza رو. يعني امکان نداره که به شما صفحه رو معرفي کنه که فقط شامل ali و reza باشه. صفحه هايي که معرفي ميشن يا ali رو دارن، يا جفت mamad و reza رو دارن، يا هر سه تا رو شامل ميشن! يه چيزي تو همون مايه هاي جبر مجموعه هاي درس جبره!
عملگرهاي بولين بيشتر از اينا هستن، ولي جديدا منسوخ شدن و ازشون استفاده نميشه. مثلا NOT, XOR و NEAR. به اين نکته هم توجه داشته باشين که بعضي از Search Engineها اين عملگرها رو فقط با حروف بزرگ ميشناسن .
Plus / Minus:
تو اين روش همونطوري که از اسمش معلومه از علامت هاي + و - استفاده ميشه.
+: از اين عملگر، دقيقا مثل عملگر AND استفاده ميکنن. يعني "ali"+"mamad" دقيقا کار ali AND mamad رو انجام ميده .
-: اين عملگر باعث ميشه که صفحاتي نشون داده بشين که شامل Keyword اولي باشن ولي Keyword دومي رو نداشته باشن. مشابه NOT در عملگرهاي Boolean. مثلا "ali"-"mamad" صفحاتي رو شامل ميشه که ali رو داشته باشن ولي به هيچ وجه mamad رو نداشته باشن. اين عملگر هم باعث ميشه که مثل + و AND به نتايج کمتر ولي دقيق تري برسيم.
مسئله اي که هست اينه که براي اين روش حتما بايد Keywordها رو بين " " قرار بديم. يه نکته هم که هست اينه که اغلب بايد هيچ گونه Spaceي خارج از گيومه استفاده نکنيم. مثلا اين جستجو غلطه "ali" + "mamad" ولي اين يکي درسته "david beckham"+"ali"
Phrases:
عبارت رو بالا توضيح دادم، ولي يه بار ديگه ميگم. هر موقع که چند تا کليدواژه رو بين " " قرار بديم يه عبارت ساختيم. يعني مثلا نتيچه جستجوي "ali mamad" صفحاتي است که دو کلمه ali و mamad رو دقيقا کنار هم داشته باشه و ali مقدم بر mamad باشه. اين عملگر مشابه عملگر NEAR بولين هستش.
Stemming:
براي امتحان کردن اين روش جستجو، من سايت InfoSeek.Go.Com رو پيشنهاد ميکنم.
پايه و اساس اين روش استفاده از کاراکتر * است. يعني مثلا اگه ما در InfoSeek براي Stream* جستجو کنيم، چند کليدواژه از طرف خود سايت در نظر گرفته ميشه که همه شون با کلمه Stream شروع ميشن. مثلا Stream, Streaming, Streamline, Streamer و ...
Case Sensitive:
و بالاخره مورد آخر رو بعضي سايت ها مثل Yahoo ساپورت ميکنن. از اسم اين روش هم مشخصه که اينگونه جستجوها به کوچک و بزرگ بودن حروف Keyword حساسيت نشون ميده.
مثلا David Beckham, Roberto Carlos دقيقا کار "David Beckham"+"Roberto Carlos" رو انجام ميده. ولي خب خيلي راحت تره. مخصوصا اينکه ميشه با يه کاما عبارت رو از هم جدا کرد. منتها اين رو بگم که اين مورد براي جستجوي افراد مشهور کاربرد زيادي داره.
خب ديگه، حالا با استفاده از اين روش ها خيلي راحت تر ميتونين در اينترنت، در هر سايتي که امکان جستجو داره، به کندوکار بپردازيد. البته اين روزا اکثرا يه قسمتي رو Search Engineها با نام Advanced Search ميبينيم که با چند تا سوال از ما دقيقا همين کارهاي بالا رو انجام ميده. منتها پشت صحنه رو ما نميبينيم. با اينکه راحتي کاربرا يکي از سياست هاي اينطور سايت هاست، ولي به نظر من استفاده دستي از اين کدها خيلي راحتتر از استفاده از صفحه Advanced Serachه!