Китайцы создали высокоэффективного ИИ-цензора
14 апреля 2021 года
Два года назад компания Google представила новый поисковый алгоритм BERT для лучшей обработки запросов на разных языках. С помощью нейронной сети алгоритм анализирует не отдельные слова, а предложения целиком, что существенно улучшает релевантность выдачи. Оказалось, что на базе BERT можно создать крайне эффективного ИИ-цензора, чем воспользовались китайские разработчики.
Он позволяет находить подлежащие цензуре тексты с точностью в 91%, утверждают исследователи. При этом, например, поиск по ключевым словам даёт точность в 70%, а у обученной людьми нейросети — 80%.
Алгоритм Google BERT с открытым кодом не может анализировать тексты длиной более 512 слов. Чтобы обойти это ограничение разработчики из Шэньянского университета Лигун и Китайской академии наук разработали алгоритм для разбивки больших текстов на доступные для анализа с помощью BERT и технологию последующей сборки текстов до первоначального объёма. Получилось решение, которое может искать даже скрытый между строк подтекст.
Интернет в Китае находится под строгим контролем правительства. Здесь заблокированы сайты Google, Facebook, Twitter, Википедии иностранных новостных агентств, Викиновости и т. д., а на тех сайтах, которые разрешены, большой процент информации цензурируется. Среди запрещённых в китайском интернет-пространстве тем — порнография, злоупотребление наркотиками, оружие и терроризм. Также нельзя критиковать компартию и её верхушку.
Источники
[править]Эта статья содержит материалы из статьи «Китайцы создали высокоэффективного ИИ-цензора», опубликованной на сайте SecurityLab.ru и распространяющейся на условиях лицензии Creative Commons Attribution 3.0 Unported (CC-BY 3.0 Unported). |
Комментарии[править]
Если вы хотите сообщить о проблеме в статье (например, фактическая ошибка и т. д.), пожалуйста, используйте обычную страницу обсуждения.
Комментарии на этой странице могут не соответствовать политике нейтральной точки зрения, ��днако, пожалуйста, придерживайтесь темы и попытайтесь избежать брани, оскорбительных или подстрекательных комментариев. Попробуйте написать такие комментарии, которые заставят задуматься, будут проницательными или спорными. Цивилизованная дискуссия и вежливый спор делают страницу комментариев дружелюбным местом. Пожалуйста, подумайте об этом.
Несколько советов по оформлению реплик:
- Новые темы начинайте, пожалуйста, снизу.
- Используйте символ звёздочки «*» в начале строки для начала новой темы. Далее пишите свой текст.
- Для ответа в начале строки укажите на одну звёздочку больше, чем в предыдущей реплике.
- Пожалуйста, подписывайте все свои сообщения, используя четыре тильды (~~~~). При предварительном просмотре и сохранении они будут автоматически заменены на ваше имя и дату.
Обращаем ваше внимание, что комментарии не предназначены для размещения ссылок на внешние ресурсы не по теме статьи, которые могут быть удалены или скрыты любым участником. Тем не менее, на странице комментариев вы можете сообщить о статьях в СМИ, которые ссылаются на эту заметку, а также о её обсуждении на сторонних ресурсах.
- 14 апреля 2021
- Новости 2021 года
- 2021
- 14 апреля
- Апрель 2021
- Материалы SecurityLab.ru
- BERT (языковая модель)
- Азия
- Алгоритмы
- Безопасность
- Блокирование Википедии
- Блокирование Википедии в КНР
- Викиновости
- Википедия
- Глубокое обучение
- Государственный совет КНР
- Золотой щит
- Интернет
- Интернет в Китае
- Интернет в США
- Интернет-цензура
- Интернет-цензура в Китае
- Информационная безопасность
- Информационная безопасность в Китае
- Информационные агентства
- Информационный поиск
- Искусственный интеллект
- Китай
- Китайская академия наук
- Ключевые слова
- Коммунистическая партия Китая
- Компьютерные технологии
- Компьютерные технологии в Китае
- Компьютерные технологии в США
- Критика
- Машинное обучение
- Наркотики
- Наука и технологии
- Нейронные сети
- Оружие
- Открытое программное обеспечение
- Поиск
- Поисковые запросы
- Поисковые системы
- Политика
- Политика Китая
- Порнография
- П��едложения (лингвистика)
- Программное обеспечение
- Релевантность (информационный поиск)
- Сайты
- Северная Америка
- Слова
- США
- Терроризм
- Технологии
- Технологии в Китае
- Технологии в США
- Трансформер (модель машинного обучения)
- Цензура
- Цензура в Китае
- Шэньянский университет Лигун
- Языки и диалекты
- Опубликовано