tokimikichika / html-parser
HTML page parser by URL
Installs: 21
Dependents: 0
Suggesters: 0
Security: 0
Stars: 0
Watchers: 0
Forks: 0
Open Issues: 0
pkg:composer/tokimikichika/html-parser
Requires
- php: >=8.0
Requires (Dev)
- phpunit/phpunit: ^10.0
README
Простая библиотека для получения HTML по URL и извлечения базовой информации.
Установка
Если используешь как отдельный пакет:
composer require tokimikichika/html-parser
Если используешь в монорепозитории как path-репозиторий, добавь в composer.json:
{ "repositories": [ { "type": "path", "url": "../../html-parser" } ], "require": { "tokimikichika/html-parser": "*" } }
Затем:
composer update
Использование
Простое использование
use Tokimikichika\HtmlParser\HtmlParser; $parser = new HtmlParser(); $html = $parser->fetch('https://example.com'); $title = $parser->getTitle($html); $links = $parser->getLinks($html);
Обработка ошибок сети
use Tokimikichika\HtmlParser\HtmlParser; use RuntimeException; $parser = new HtmlParser(); try { $html = $parser->fetch('https://invalid-host'); } catch (RuntimeException $e) { }
Архитектура
HtmlParser
— основной класс:fetch(string $url)
— получает HTML по URL с таймаутом и валидациейgetTitle(string $html)
— извлекает<title>
getLinks(string $html)
— извлекает значенияhref
из ссылок
Возможности
- Получение HTML с кастомным User-Agent и таймаутом
- Извлечение заголовка страницы
- Извлечение ссылок (
href
) из документа - Минимальные зависимости
Тестирование
composer install
composer test
Лицензия
MIT