tokimikichika/html-parser

HTML page parser by URL

Installs: 21

Dependents: 0

Suggesters: 0

Security: 0

Stars: 0

Watchers: 0

Forks: 0

Open Issues: 0

pkg:composer/tokimikichika/html-parser

v0.1.0 2025-10-17 14:40 UTC

This package is auto-updated.

Last update: 2025-10-17 14:42:52 UTC


README

Простая библиотека для получения HTML по URL и извлечения базовой информации.

Установка

Если используешь как отдельный пакет:

composer require tokimikichika/html-parser

Если используешь в монорепозитории как path-репозиторий, добавь в composer.json:

{
  "repositories": [
    { "type": "path", "url": "../../html-parser" }
  ],
  "require": {
    "tokimikichika/html-parser": "*"
  }
}

Затем:

composer update

Использование

Простое использование

use Tokimikichika\HtmlParser\HtmlParser;

$parser = new HtmlParser();
$html = $parser->fetch('https://example.com');
$title = $parser->getTitle($html);
$links = $parser->getLinks($html);

Обработка ошибок сети

use Tokimikichika\HtmlParser\HtmlParser;
use RuntimeException;

$parser = new HtmlParser();

try {
    $html = $parser->fetch('https://invalid-host');
} catch (RuntimeException $e) {
}

Архитектура

  • HtmlParser — основной класс:
    • fetch(string $url) — получает HTML по URL с таймаутом и валидацией
    • getTitle(string $html) — извлекает <title>
    • getLinks(string $html) — извлекает значения href из ссылок

Возможности

  • Получение HTML с кастомным User-Agent и таймаутом
  • Извлечение заголовка страницы
  • Извлечение ссылок (href) из документа
  • Минимальные зависимости

Тестирование

composer install
composer test

Лицензия

MIT