tokimikichika / html-parser
HTML page parser by URL
Installs: 32
Dependents: 0
Suggesters: 0
Security: 0
Stars: 0
Watchers: 0
Forks: 0
Open Issues: 0
pkg:composer/tokimikichika/html-parser
Requires
- php: >=8.0
Requires (Dev)
- phpunit/phpunit: ^10.0
README
Простая библиотека для получения HTML по URL и извлечения базовой информации.
Установка
Если используешь как отдельный пакет:
composer require tokimikichika/html-parser
Если используешь в монорепозитории как path-репозиторий, добавь в composer.json:
{
"repositories": [
{ "type": "path", "url": "../../html-parser" }
],
"require": {
"tokimikichika/html-parser": "*"
}
}
Затем:
composer update
Использование
Простое использование
use Tokimikichika\HtmlParser\HtmlParser; $parser = new HtmlParser(); $html = $parser->fetch('https://example.com'); $title = $parser->getTitle($html); $links = $parser->getLinks($html);
Обработка ошибок сети
use Tokimikichika\HtmlParser\HtmlParser; use RuntimeException; $parser = new HtmlParser(); try { $html = $parser->fetch('https://invalid-host'); } catch (RuntimeException $e) { }
Архитектура
HtmlParser— основной класс:fetch(string $url)— получает HTML по URL с таймаутом и валидациейgetTitle(string $html)— извлекает<title>getLinks(string $html)— извлекает значенияhrefиз ссылок
Возможности
- Получение HTML с кастомным User-Agent и таймаутом
- Извлечение заголовка страницы
- Извлечение ссылок (
href) из документа - Минимальные зависимости
Тестирование
composer install
composer test
Лицензия
MIT