استخراج محتوای سایتها

saalek110

Well-Known Member




سالک:
فعلا دو کاربرد بر این کار من در نظر دارم ،

یکی نمایش اجزایی از سایتها در سایت خودمان ،
و دوم دریافت اطلاعاتی از سایتها و کار بر اون اطلاعات ، مثلا قیمت چیزها.
 
آخرین ویرایش:

saalek110

Well-Known Member

در تاپیک بالا این بحث شده.
 

saalek110

Well-Known Member
برای نوشتن دستورات preg_match باید با Regex (زبان عبارات با قاعده) آشنا باشید، Regex شما در کدهای بالا معتبر نیست، نمونه صحیح:
PHP:
<?php
$content = file_get_contents('http://webgoo.ir');
$footer = preg_match("/<div class=\"footer-txt\"[^>]*>(.*?)<\\/div>/ims", $content, $match);
echo $match[1];
?>

کد فرضی بالا اطلاعات را از صفحه اول سایت ما دریافت کرده و مقادیر متنی خط زیر را استخراج می کند:

PHP:
<div class="footer-txt">
مقادیری که استخراج می شود
</div>


منبع:
 

saalek110

Well-Known Member
PHP:
<!DOCTYPE html>
 
<body>
    <?php
        // Reading contents from the
        // geeksforgeeks homepage
        $str = file_get_contents(
            "https://www.geeksforgeeks.org/");
        echo $str;
    ?>
</body>
</html>


کد بالا ،‌محتوای یک سایت را می گیرد و چاپ می کند.
ادرس یک سایت دیگر را بگذارید.
 
آخرین ویرایش:

saalek110

Well-Known Member
در کد بالا بدون هیچ کاری روی محتوای سایت ان را چاپ کردیم و در پست بعد می خواهم کارهایی روی آن انجام دهیم.
 

saalek110

Well-Known Member
در برنامه دوم ، قبل چاپ این خط را اعمال کنید:

PHP:
$str=htmlspecialchars($str);

من برای این ، این کار را کردم تا کدهای سایت خنثی بشه و بتونم کدهای سایت را ببینم.
 

جدیدترین ارسال ها

بالا