Компания Brave открыла исходный код нового инструмента под названием Cookiecrumbler, который использует большие языковые модели (LLM) для выявления уведомлений о согласии на использование cookies, а также обзоры сообщества для их проверки и блокировки там, где это не нарушает работу сайта.
Браузер Brave по умолчанию блокирует баннеры согласия на использование куки на всех сайтах с 2022 года, однако выяснилось, что такое блокирование иногда вызывает серьезные проблемы — сайт становится неудобным или вообще неработоспособным.
Brave поясняет:
Слишком широкая или неправильная блокировка может нарушить критически важные функции сайта — от оформления заказов до некорректного отображения страниц.
Мы сталкивались с множеством проблем (сломанная прокрутка, пустые страницы) при бездумной блокировке уведомлений о cookies.
Cookiecrumbler использует ИИ для поиска сайтов, использующих платформы управления согласием (Сonsent Management Platforms, CMP), и регистрирует такие случаи в своем проекте на GitHub. Предложения Cookiecrumbler затем проходят ручную проверку, чтобы избежать поломки функциональности сайтов.
Работа инструмента устроена следующим образом:
- Обходит популярные сайты с помощью прокси-серверов для разных регионов.
- Загружает страницы с помощью Puppeteer для поиска потенциальных баннеров cookies.
- Передает найденное LLM для классификации и предложений по исправлению.
- Публикует результаты обнаружения в виде задач на GitHub для дальнейшей проверки и улучшений сообществом.
Таким образом, Cookiecrumbler позволяет масштабно и с учетом региональных особенностей обнаруживать и блокировать баннеры cookies, снижая количество ошибок и проблем с работой сайтов.
Так как Brave ориентирован на защиту конфиденциальности, в анонсе подчеркивается, что Cookiecrumbler не раскрывает никаких чувствительных данных:
- Во-первых, Cookiecrumbler работает полностью на стороне серверов Brave, а не в браузере пользователя, поэтому пользовательские данные не участвуют в процессе обнаружения и анализа.
- Во-вторых, инструмент не взаимодействует с реальными пользовательскими сессиями: вместо этого он использует прокси и автоматизированные краулеры, которые имитируют просмотр сайтов из разных регионов, используя публичные списки сайтов, такие как Tranco.
Забота о приватности — главная причина, по которой Cookiecrumbler пока не интегрирован в браузер Brave, а используется только как внутренний инструмент для анализа.
Компания Brave Software отмечает, что Cookiecrumbler будет встроен в браузер только после полной проверки на соответствие строгим требованиям к приватности пользователей.
Поскольку Cookiecrumbler — это открытый и бесплатный проект, доступный на GitHub, им могут пользоваться и другие разработчики инструментов защиты конфиденциальности, аудиторы сайтов, составители списков для блокировщиков рекламы или просто технически подкованные пользователи, которые хотят создавать или улучшать собственные фильтры.
Обновления программ, что нового
• Представлен бюджетный смартфон Realme P4 Lite 4G: батарея 6300 мАч и защита MIL-STD-810H
• Новые функции Android 17 – нативная блокировка программ и общий буфер обмена
• Google Chrome получил новые инструменты для продуктивной работы
• Утечка: Google готовит чип безопасности Titan M3 для процессоров Tensor G6
• Google выпустила Gemini 3.1 Pro с двукратным ростом в ARC-AGI-2 и поддержкой визуальных интерфейсов
• Технология Microsoft Project Silica: запись терабайтов данных на стеклянные пластины для хранения 10 000 лет