UGC-сервис для сбора пользовательских действий и дальнейшей аналитики.
- ETL Kafka -> Clickhouse
- Kafka, Apache Spark research
- Tests
- docker-compose file
- Clickhouse, Vertica research
- UGC API
- nginx
- make up - запуск
- make down - удалить созданные контейнеры
- make downv - удалить созданные контейнеры, включая volumes
cd tests
make test
- общий: http://localhost
- openapi: http://localhost/api/openapi
- Клики: пользователь(id), элемент, timestamp
- Просмотр страниц: пользователь(id), страница, сколько времени проведено, timestamp
- Кастомные сущности: пользователь(id), событие, детали события, timestamp,
Возможные события:
- смена качества видео(переключение с какого на какое качество?)
- просмотр видео до конца(какого видео?)
- использование фильтра поиска(по какому фильтру(ам)? какое значения фильтра?)
- Масштабируемость(обеспечение устойчивой работы при увеличении нагрузки)
- Производительность(скорость отклика ниже 200мс)
- Надежность:
- Для записи: 99.8%
- Для аналитики: 90%(не гарантируется ночная работа)
- Ручки для отправки информации по сущностям(разные ручки):
- клики
- просмотр страницы
- кастомные сущности
- Возможность получить и проанализировать информацию из ClickHouse