Что это?
Платформа для парсинга данных из конференций, соцсетей и реестров компаний. AI извлекает структуру из произвольного HTML и складывает всё в единую базу с веб-UI и CLI.
Платформа для парсинга данных из конференций, соцсетей и реестров компаний. AI извлекает структуру из произвольного HTML и складывает всё в единую базу с веб-UI и CLI.
Платформа для парсинга данных из конференций, соцсетей и реестров компаний. AI извлекает структуру из произвольного HTML и складывает всё в единую базу с веб-UI и CLI.
Дни ручного сбора по десяткам разрозненных сайтов → один автоматический pipeline на FastAPI
Реализовано на стеке: FastAPI, Python, Playwright, PostgreSQL. FastAPI-приложение с тремя модулями (events, outreach, companies), Playwright для JS-страниц и LLM для извлечения структуры из любого HTML.

Данные о спикерах, компаниях и контактах живут на десятках сайтов с разной структурой, JS-рендерингом и форматами.
FastAPI-приложение с тремя модулями (events, outreach, companies), Playwright для JS-страниц и LLM для извлечения структуры из любого HTML.
Точка входа
FastAPI · Jinja2 · Click CLI
Извлечение HTML
Playwright · BeautifulSoup · httpx
Структурирование данных
LLM · промпт-шаблоны
База и кэш
PostgreSQL · Redis · SQLAlchemy
Точка входа
FastAPI · Jinja2 · Click CLI
Извлечение HTML
Playwright · BeautifulSoup · httpx
Структурирование данных
LLM · промпт-шаблоны
База и кэш
PostgreSQL · Redis · SQLAlchemy
быстрее ручного сбора
ручной обработки HTML
автономный парсинг