sitecrawler / sitecrawler
There is no license information available for the latest version (dev-main) of this package.
Package for parsing site metadata
dev-main
2024-01-17 08:56 UTC
Requires
- php: ^8.0
- ext-curl: *
- guzzlehttp/guzzle: ^7.2
- simplehtmldom/simplehtmldom: dev-master
This package is not auto-updated.
Last update: 2024-06-14 14:39:47 UTC
README
Для установки выполнить команду:
composer require sitecrawler/sitecrawler
Требования
Необходимо задать следующие значения php:
set_time_limit(-1);
ini_set('memory_limit', -1);
ini_set('max_execution_time', -1);
Использование
Подключение:
use SiteCrawler\Parser;
Запуск парсера:
$parser = new Parser("Домен");
$result = $parser->parse();
Вернуть домен:
$domain = $parser->getDomain();
Возвращает массив всех страниц сайта с метатегами, а также ошибки, если таковые имеются.
Метатеги:
- h1
- title
- description