Создана компьютерная модель, способная пройти тест CAPTCHA

Американские программисты создали алгоритм, способный обмануть один из самых распространенных тестов на проверку пользователей CAPTCHA. Капча (от англ. CAPTCHA — Completely Automated Public Turing test to tell Computers and Humans Apart) — компьютерный тест, с помощью которого система определяет, является ли пользователь человеком или компьютером. Это один из примеров теста Тьюринга. Основная идея теста — предложить пользователю такую задачу, которая с легкостью решается человеком, но не выполнима для компьютера.

Визуализация схемы опознания компьютерной моделью буквы АВизуализация схемы опознания компьютерной моделью буквы А
© Vicarious AI

Самый распространенный вид капчи — буквенные шифры различных стилей с добавлением помех (полупрозрачность, изогнутые символы). Человеческий мозг способен обобщать и учиться на небольшом количестве примеров, в то время как ранее созданные компьютерные алгоритмы по решению капчи для «тренировки» требовали миллионы примеров, чтобы научиться распознавать шифр.

Компания Vicarious несколько лет назад взялась за амбициозную задачу — с помощью методов машинного обучения создать программу, способную распознавать капчу. Разрабатываемый алгоритм они назвали рекурсивной корковой моделью (Recursive Cortical Network — RCN). Идея распознавания объекта возникла на стыке нейронаук и лингвистики. Главной задачей разработчиков было научить компьютер обобщать полученную во время обработки капчи информацию и высказывать предположения о входящих данных: какую букву или символ представили системе.

RCN представляет собой иерархическую структуру, которая моделирует объект как комбинацию контуров и поверхностей. Модель «опознает» контур фигуры в случае, когда свойства поверхности (цвет) резко меняются. Представление о контурах позволяет распознавать объект с совершенно разными формами, а иерархическая система позволяет выдвинуть наиболее вероятное предположение об объекте.

При этом алгоритм RCN способен не только взломать капчу, но и идентифицировать рукописные символы, распознать слоистые структуры и текст на фотографиях. По сравнению с современными подходами машинного обучения к распознаванию текста, RCN имеет более высокую точность при использовании примерно в 5000 раз меньшего количества обучающих образов. Успех разработчиков из Vicarious подталкивает программистов к созданию более надежных методов защиты от спама и проверки пользователей.

Результаты исследования разработчиков опубликованы в журнале Science
Источник: chrdk.ru

Метки , . Закладка постоянная ссылка.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *