Что означает термин капча
Капча: что это такое простыми словами
Несомненно, что все пользователи Глобальной сети сталкивались с такой насущной проблемой, но не каждый знает о том, что это и есть так называемая капча. Так же не многим известно, что на английском CAPTCHA – это аббревиатура, которая в переводе на русский язык значит: полностью автоматизированный и общедоступный тест Тьюринга, чтобы отличить компьютер от человека.
Что такое капча
Из расшифрованной выше аббревиатуры уже можно понять, что такое капча, простыми словами –она определяет, является ли пользователь реальным или спам-роботом. Так, возможно, на некоторых сайтах, чтобы узнать цену СЕО-продвижения придётся для начала ввести проверочный код. Капча генерирует сочетания из различных букв, цифр и знаков, полагаясь на способность человека определять, какими на самом деле символами они являются.
Чтобы подтвердить цифровую транзакцию, используя систему капчи, пользователю предоставляется искаженное слово, обычно помещаемое поверх искаженного фона. Пользователь должен ввести слово в поле, чтобы завершить процесс. Компьютерам трудно декодировать искаженные слова, в то время как люди могут легко расшифровать текст.
Некоторые капчи теперь используют картинки вместо слов, где пользователю предоставляют серию картинок и спрашивают, что является общим элементом среди всех картинок. Вводя этот общий элемент, пользователь проверяет транзакцию, и компьютер знает, что имеет дело с человеком, а не с ботом.
Что такое капча при регистрации
Многие задаются вопросом, что такое капча при регистрации и зачем она нужна. Да, зачастую, мы можем встретить капчу при заполнении регистрационных форм. Например, Вы думаете о том, как найти человека по почте, для этого нужно зарегистрироваться. Это вполне нормально и безобидно. В таких случаях капча направлена на борьбу с ботами, которые создают множество учётных записей для рассылки спама.
На веб-сайтах по продаже билетов, также используется капча, чтобы не допустить чрезмерного приобретения билетов на большие мероприятия скальперами (сторонниками скоростной торговли/спекуляции). Это позволяет законопослушным клиентам покупать билеты справедливо и не дает скальперам размещать тысячи заказов.
Наконец, веб-страницы или блоги, содержащие доски объявлений, например, о стоимости разработки сайта-визитки, или контактные формы, используют капчу для предотвращения спам-сообщений или комментариев. То есть помогает избежать автоматическую публикацию сообщений ботами.
Неверная капча: что это такое
Рассмотрим, что такое неверная капча и чем она грозит. Неверная капча означает то, что при регистрации или при совершении любой другой операции Вы неправильно ввели предложенные Вам символы с картинки.
Если Вы допустили ошибку, придётся сделать это заново, но, конечно же, символы будут уже совсем другие. С такой проблемой пользователи сталкиваются очень часто, так как разобрать трудночитаемые искажённые символы достаточно затруднительно.
К сожалению, поскольку технологии и хакеры становятся более продвинутыми, их мошенническая тактика тоже. Чтобы полностью разобраться в теме и огородить себя от нежелательных последствий изучите, что такое спам в Интернете и чем он грозит. В то время, как сама система капчи безопасна, киберпреступники начали включать её в свои ложные или мошеннические веб-сайты, чтобы совершать свои действия более правдоподобно.
С помощью интригующих сообщений в ленте злоумышленники могут обмануть пользователей, например: «Вся страна в шоке, предсказания о конце света оказались..». После того, как Вы нажмете на эту запись, нужно будет ввести поддельный проверочный код и перейти на целевую страницу. В это время вирус захватит Ваш аккаунт.
Сегодня мы разобрались в том, что такое капча и для чего она нужна. Узнать, как от неё избавиться можно на примере нашего рассказа о том, как убрать капчу в Яндекс Вордстат и будет ли это эффективно. Будьте внимательны и не попадайтесь на уловки интернет-мошенников.
Немного об истории CAPTCHA
Системы глубокого анализа трафика имеют дополнительную защитную функцию. Речь идет о защите от DDoS. Для этого используется один из самых популярных и эффективных способов — CAPTCHA, или полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей.
Сам по себе тест достаточно известен, однако в его истории и эволюции есть несколько любопытных фактов, о которых мы хотим сегодня рассказать.
Оригинальная система была разработана в начале XXI века инженерами из Университета Карнеги — Меллона, США. Команда под руководством Луиса фон Ана (Luis von Ahn) искала способ фильтрации регистраций на сайтах, выполняемых автоматическими программами и спам-ботами.
Команда разработала систему, показывающую пользователю сильно искаженный текст, который невозможно распознать программными алгоритмами. Работу с ресурсом можно было продолжать только после того, как отображаемое слово было корректно введено в намеченное поле. Решение получилось настолько удачным, что стало активно применяться по всему миру.
Однако это быстро привело к появлению нового вида заработка в интернете — решению задач CAPTCHA. Спамеры начали платить людям за ввод «контрольной фразы». Такой доход стал популярен в бедных странах, где возможность получить пусть и минимальные деньги за тысячи решений CAPTCHA достаточно привлекательна.
Несмотря на это, сервис не утратил популярности, наоборот, разработчиков начала беспокоить мысль, что они заставляют миллионы людей бессмысленно переводить изображения в текст, понапрасну растрачивая время и усилия, не принося никакой практической пользы. Поэтому Луис задался вопросом: «Можно ли сделать с этим временем что-то полезное?».
И нашел на него ответ, представив приложение reCAPTCHA спустя некоторое время. Оно по-прежнему было «завязано» на вводе изображений с картинки, но вместо случайного набора символов пользователь должен был «расшифровать» реальный текст из архивных документов. Программное обеспечение того времени уже было способно распознавать печатные тексты с достаточно высокой точностью, однако все равно в книгах со временем чернила расплываются, что мешало компьютерам определить некоторые слова. Человек же с этим справляется без особых проблем.
Первыми в очереди на распознавание оказались архивные номера газеты The New York Times. После этого, когда в 2009 году сервис купила компания Google, расшифровке подверглись старые книги. Получается, что каждый раз, вводя текст с reCAPTCHA, вы разбираете фрагменты из реальных архивных текстов. Луис фон Ан был очень доволен новой версией программы, уверяя, что сервис проживет очень долго, поскольку печатного материала в архивах предостаточно.
Подобные эксперименты были проведены и по распознаванию изображений из Google Maps и Google Street View. Однако в скором времени аналитикам компании Google пришлось искать ответ на успешные попытки автоматизации «взлома» даже самых сложных изображений с вероятностью, превышающей 90%.
Для решения возникшей проблемы Google начали совершенствовать технологию, и в 2015 году инженеры компании представили новое решение, которое не обязывало пользователя распознавать символы. Новая система анализировала поведение пользователя на сайте до момента нажатия проверочной кнопки «Я не робот», а затем делала вывод: человек это или бот.
Если анализ не давал однозначного результата, то пользователю предлагалось пройти дополнительную проверку, например, выбрать из нескольких картинок все, на которых изображены деревья.
Другие CAPTCHA и иные решения
Помимо самых распространенных систем от компании Google, сегодня имеются и другие решения, направленные на различение человека и машины. Так, разработчики сервиса TextCAPTCHA предлагают пользователям отвечать на простые логические вопросы. Например, о том, какая буква в слове «автомобиль» стоит на третьем месте.
Считается, что таких запутанных формулировок будет достаточно, чтобы обмануть «автомат», а конкретные вопросы гораздо проще в плане восприятия человеком. Также некоторые разработчики тестов Тьюринга придерживаются мнения, что лучше просить пользователей решать несложные математические уравнения.
Еще одно интересное решение было предложено Facebook в январе 2011 года. Компания экспериментировала с так называемой социальной аутентификацией. По словам представителей компании, идея заключалась в том, чтобы показать пользователю несколько фотографий его друга и попросить назвать его имя.
Специалисты Facebook были уверены в том, недоброжелатели могут быть едва ли знакомы с вашими друзьями и не станут собирать всю информацию о вам круге общения, что в целом достаточно спорное утверждение.
Также различными онлайн-сервисами используются и другие методы «фильтрации» пользователей, которые дают еще один уровень защиты. Они заменяют или дополняют CAPTCHA.
/ Flickr / Tarek / CC
Honeypot. В 2007 году Фил Хаак (Phil Haack) предложил любопытный метод определения ботов. Он получил название Honeypot. Его особенность заключается в добавлении дополнительного поля при заполнении онлайн-формы, которое было бы невидимо для пользователя-человека. Бот не способен понять, видимо это поле или нет, потому заполняет его «по инерции», что позволяет администратору заблокировать регистрацию как спам.
Временные ограничения. В среднем, сколько времени вам требуется на заполнение онлайн-формы с 10 полями? Большинство людей тратит на это несколько минут, в то время как боты делают это практически мгновенно. Идея решения состоит в том, чтобы отметить как подозрительные все регистрации, поля формы во время которой были заполнены быстрее определенного промежутка времени. Этот способ хорошо работает до тех пор, пока спамеры не поймут, что такой временной порог существует, после этого они учат свои системы заполнять поля ввода помедленнее.
Интересные и простые игры. Использование игр в борьбе против спама становится быстрорастущей тенденцией. Вместо того чтобы вводить «капчу», компании просят пользователей сыграть в небольшую игру, дабы доказать свою «человечность». Игры могут быть самыми разными: небольшие платформеры (по типу Марио) или же аркады, например, с ракетой в космосе, которую нужно провести через метеоритный пояс. Помимо стандартных функций защиты от ботов, такое решение добавляет в достаточно рутинную операцию немного веселья.
Аудиокапчи. Это альтернатива визуальной CAPTCHA. Сервис сам «говорит», какие слова нужно ввести. И хотя это решение в теории выглядит эффективным, на практике все упирается в качество колонок компьютера пользователя. А если в доступности у пользователя нет акустической системы или наушников, то он не сможет пользоваться сервисом.
«Гонка вооружений» между специалистами по безопасности и спамерами никогда не закончится. Поэтому постоянно будут разрабатываться все новые механизмы защиты и их обхода. Но несмотря на это технология reCAPTCHA остается одним из самых надёжных способов борьбы с ботнет-сетями и успешно применяется в системе DPI СКАТ для защиты от DDoS-атак. Постоянная разработка платформы и выпуск новых версий позволяет использовать актуальные механизмы защиты.
Как это работает: CAPTCHA
Сколько лет существует Хабр — столько лет на нём регулярно появляются посты про очередную капчу — будь то скрипт генерации картинки, новая идея капчи с котиками и тому подобное. Самый свежий пример того, что человек не совсем понимает — как же всё таки должна работать капча (см. текст поста и последние комментарии), но при этом делится своими заблуждениями с сообществом. Складывается ощущение, что капча — это такая terra incognita для большинства разработчиков — как для тех, кто просто прикручивает её к очередной форме в надежде на то, что она будет работать «из коробки», так и для тех кто придумывает капчи вроде тех, на которых надо выбрать картинку с котиком из нескольких фото.
Статья содержит полезную информацию для тех, кто использует капчу на своём сервере, вместо того чтобы довериться стороннему сервису вроде reCaptcha.
Captcha
Согласно своему определению, captcha — это автоматизированный публичный тест Тьюринга (тест который может пройти человек, но не компьютер). В статье я буду рассматривать свойтсва капчи на примере самого распространненого её вида — текста на картинке, хотя почти все написанное одинаково применимо к любому виду капчи.
Два главных свойства капчи
Любая капча должна обладать двумя свойствами, без которых она не будет работать:
Устойчивость к распознаванию — свойство, защищающее капчу от распознавания алгоритмом — например системой распознавания текста. Гарантирует то, что человек сможет прочитать текст на картинке, а компьютер нет.
Антипример: стандартная капча форумов phpBB 2.x таким свойством не обладала — из-за относительной простоты распознавания появились скрипты, которые спамили все подряд форумы вынуждая веб-мастеров менять капчу на более стойкую.
Устойчивость к угадыванию — свойство капчи, не позволяющее угадать её значение за небольшое число попыток (менее 1000). Если набор возможных значений капчи невелик, программе не составит труда угадать её подбором вместо распознавания.
Антипример: арифметическая капча вроде «1+2» (перебор чисел от 1 до 20 в скором времени даст результат).
Антипример: выбрать из нескольких картинок ту, на которой изображён котик.
Проверка капчи
Значение для проверки должно храниться на сервере, а не передаваться вместе с картинкой в браузер. Для сопоставления посетителя и правильного значения капчи необходимо использовать некий ключ, который передаётся вместе с капчей (идентификатор сессии, номер капчи и т.п.)
Антипример: если передавать саму капчу и значение для ее проверки (в том числе зашифрованное), то человеку достаточно один раз распознать такую капчу и далее использовать комбинацию «ответ»-«значение для проверки» в своём скрипте (по ссылке в начале поста как раз такой случай)
После проверки, сохраненное значение капчи необходимо удалить. Если не сделать этого, злоумышленник сможет использовать данное значение снова неограниченное число раз. Да, при обновлении страницы с формой обновляется и капча (либо при генерации формы, либо при генерации картинки), вот только скрипт может не загружать форму снова (надо упомянуть, что это не актуально если на сайте используются одноразовые csrf-токены для форм).
Антипример: гипотетическая форма логина, в которой достаточно один раз ввести капчу правильно, и далее подбирать пароль скриптом, избегая перегенерации капчи на сервере.
Пуленепробиваемая капча
Защита от перебора. Если ваша капча устойчива к распознаванию, но не очень устойчива к перебору (например на ней надо прочитать всего 3-4 цифры), желательно ограничить число неправильных ответов «с одного ip» / «для одного логина» / etc. Такие ограничения необходимо проверять ДО проверки самой капчи (то есть даже в случае правильно введенной капчи, при наличии ограничения она не должна считаться пройденной) иначе оно не будет препятствовать перебору.
Защита от DoS. При генерации капчи на своем сервере, надо понимать что это удобный вектор проведения DoS атак (которую, в отличие от DDoS, может устроить любой школьник). Для защиты можно ограничить число генерации капчи для одного ip, кэшированием капч и т.д. Подробнее про это
Защита от распознавания. Если вы выбираете капчу, или вдруг собираетесь написать её сами, желательно понимать какая капча более защищена от распознавания. Существуют готовые универсальные скрипты распознавания капчи, работающие по принципу OCR, а в случае если ваш сайт заинтересует спамеров есть риск, что будут использовать / писать скрипт конкретно под вашу капчу. Последнее правда относится больше к сайтам уровня Яндекс или vk, а вот вариант с защитой от банальных OCR желательно предусмотреть.
Защита от антигейтов. Если говорить формально, то капча как тест Тьюринга не обязана защищать вас от антигейтов, так как в этом случае её будет распознавать человек. С практической же точки зрения, этот вопрос весьма актуален и защищаться как-то надо.
Тут нет и не может быть «золотого стандарта» (ибо в таком случае антигейты внедрят его поддержку), поэтому вы вольны дополнять капчу любыми ухищрениями, чтобы сделать её распознавание через антигейт невозможным. Например:
— нестандартная капча (сбор паззла, поворот изображения, клик по области на фото и т.п.);
— кириллическая капча — самое простое решение, но имеет ряд минусов: подходит только для проектов с русскоязычной аудиторией, есть антигейты с поддержкой кириллицы;
— использование виртуальной клавиатуры рядом с капчей для ввода нестандартных символов или фигур (может быть неудобно пользователям мобильных);
Юзабилити
Не просите ввести капчу, если вы уже убедились, что перед вами человек. Тут однако, надо быть осторожным, чтобы форму нельзя было использовать скриптом неограниченное число раз после однократного ввода капчи человеком.
Пример: форма регистрации. Если я где-то регистрируюсь, и забыл ввести поле «почтовый индекс», но правильно ввёл капчу — не надо показывать мне новую. Потратьте 10 минут на то, чтобы сохранить где-то у себя, что вот эту конкретную форму сейчас пытается заполнить живой человек.
Для облегчения распознавания человеком: не используйте в капче одновременно буквы и цифры, не используйте одновременно прописные и строчные буквы, исключите похожие символы.
Отказ от использования капчи
Лучшая капча — отсутствие капчи. Там где можно отказаться от её использования — это надо сделать. Возможно для этого придется реализовать дополнительные лимиты и проверки, но пользователи скажут вам спасибо.
Но тут надо быть очень осторожным. Например: форма регистрации без капчи, с полем email на который приходит письмо с активацией. Без дополнительных средств защиты такую форму могут завалить «левыми» адресами, и ваш сайт включат в черные списки почтовые службы. В таком случае можно обходиться без капчи, но только если у вас есть другой рубеж защиты, вроде лимита по ip.
Кому то информация в этом топике покажется очевидной, но если бы я не сталкивался с примерами непонимания этих простых принципов в жизни, в том числе у опытных коллег-разработчиков, я бы не стал тратить время на написание этого текста.
Что такое капча простыми словами, зачем она нужна и можно ли на ней заработать
Непонятные цифры на картинке. Когда вы их вводите, программа понимает, что вы живой человек, а не робот.
Капча – это разные непонятные буквы или цифры на картинке. Они написаны таким образом, что понять их сможет только человек. Робот капчу ни за что не прочитает.
Капча нужна для того, чтобы доказывать какой-нибудь программе, что с ней работает живой человек, а не робот.
Давайте познакомимся с капчой подробнее. Заодно я вам расскажу, как можно зарабатывать на ней в интернете.
Что такое капча
Итак, капча – это обычно буквы и цифры, намного реже – знаки препинания. Они написаны неровно, с искажениями, на разных фонах, с какими-нибудь дополнительными элементами – разными линиями, кругами и пр.
Вот пример достаточно простой капчи.
Для чего она нужна
Она служит как бы барьером для роботов. Помогает разным программам и сервисам вычислять роботов и блокировать их действия. Например, вот я запускаю робота, который рассылает рекламные сообщения пользователям Вконтакте. Просто выбирает случайного человека в ВК и шлет ему рекламу.
Мой робот так отправляет спам одному человеку, потом другому, третьему, десятому. А потом ВК замечает, что кто-то рассылает слишком много однотипных сообщений. И показывает капчу. Робот капчу или вообще не вводит, или вводит неправильно. В результате его активность блокируется.
Это приводит к нескольким благоприятным последствиям, давайте их разберем.
Защита от взлома
Если бы не было капчи, то постепенно можно было бы взломать очень многие аккаунты без двухфакторной аутентификации. То есть создали вы аккаунт, защитили его одним только паролем. Как взломать аккаунт? Постоянно подбирать пароль. Робот может генерировать в короткий промежуток времени тысячи паролей и вполне вероятно, что рано или поздно он сумеет подобрать подходящий.
Если этого робота вовремя не остановить с помощью капчи.
Защита от спама
Вообще, со спамом в интернете идет ожесточенная борьба. Помимо капчи программы и сервисы учитывают жалобы пользователей, анализируют источники спама и стараются постоянно изобретать все новые и новые методы борьбы со злостными спамерами.
Защита от перегрузки
Перегрузить какой-нибудь сайт или сервис очень просто. Надо отправлять ему слишком много запросов за единицу времени, чтобы он не успевал их отрабатывать. Эти запросы как раз можно отправлять с помощью автоматического вредоносного ПО.
А капча – то самое спасительное средство, которое их остановит.
Как распознать капчу
Обычно у «живого» человека проблем в этом плане не возникает. Мы просто «всматриваемся» в символы и аккуратненько вводим их по одному.
Человеколюбивые сайты даже добавляют к капче функцию озвучки – символы произносятся, мы их воспринимаем на слух и набираем на клавиатуре.
Бывают, конечно, очень сложные капчи, которые не получается ввести с первого раза. Но это не приводит ни к каким печальным последствиям – просто генерируется другая капча. Живые люди рано или поздно смогут правильно ввести символы любого уровня сложности.
Можно ли автоматически распознать капчу
В общем-то, да, это становится возможным. И происходит это следующим образом. Делается база данных, в нее грузятся тысячи картинок с капчой и расшифровкой. Затем специальная программа сравнивает «искривленные» символы с их расшифровкой и «запоминает».
Таким образом шаг за шагом можно научить роботов распознавать отдельные картинки с капчой.
Но это не значит, что «противоядие найдено» и роботы теперь захватят весь интернет. Подобное обучение распознаванию капчи – дело весьма непростое. Генерировать изогнутые, перечеркнутые, наполовину замазанные и разные другие символы можно самыми разными способами, поэтому автоматическому распознаванию еще далеко до совершенства.
Как связаны капча и рукописи
На некоторых сайтах пользователям предлагается вводить две капчи. Так вот, одна из них является не распознанной и вы своим распознаванием совершаете благое дело – помогаете расшифровывать трудно читаемые тексты.
Смотрите, вот решили люди оцифровать какую-то старую-старую газету, где текст очень плохо виден. Они ее сканируют, но машина или вообще не распознает буквы, или распознает неправильно.
И чтобы эту проблему решить, делается следующее. Текст делится на слова и каждое слово рассылается миллионам людей в мире в виде капчи. Люди распознают, а результаты распознавания потом суммируются. И, например, из тысячи людей 900 введут слово одинаково, а 100 – не так, как остальные 900. Машина возьмет тот текст, который совпал у 900 людей и вставит его в оцифровку. В конечном итоге получится целостная оцифрованная газета, распознанная людьми, а не машиной.
Чуть больше дополнительной информации – вот в этом видеоролике, посмотрите.
Как заработать на капче
В интернете сейчас есть несколько сайтов, которые платят деньги за распознавание капчи. Самый популярный из них – 2captcha. Остальные я опишу в отдельной статье про сайты для заработка на капче.
Все эти проекты работают одинаково. Вы регистрируетесь, вам приходит картинка с символами, вы вводите символы, получаете оплату.
По уровню сложности капча присылается самая разная. На некоторых сайтах можно даже выбирать сложность, чтобы не мучиться с чересчур заковыристыми картинками.
Много ли платят за каждый ввод? Средняя ставка такая – 0,3 доллара за 1 000 вводов. Если доллар равен примерно 75 рублям, то получается 22,5 рубля. За тысячу вводов капчи, вы можете себе это представить?
Стоит ли на этом зарабатывать
Я думаю, нет, не стоит. Даже если вы новичок в мире интернет-заработка. Мне кажется, вы на электричество потратите больше денег, чем сможете получить на этих сервисах по распознаванию.
Вот еще несколько минусов, на которых я хочу акцентировать ваше внимание.
Зрение
Когда вы будете распознавать непонятные буквы и цифры, ваши глаза постоянно будут напрягаться. Ничего хорошего в этом нет. Если ежедневно разгадывать десятки капч, то через пару месяцев точно придется идти к окулисту.
Отсутствие роста
Чтобы зарабатывать больше денег, надо профессионально расти. Надо обучаться чему-то новому, пробовать себя в каких-то новых сферах деятельности. В общем, все время совершенствоваться.
Как вас будет совершенствовать капча? Вообще никак. Если вы десять лет будете ее вводить, все, чему вы научитесь, – это распознавание капчи. Чуть более быстрое, чем у «обычного» человека. И не более.
Кто-то за десять лет выучит несколько языков программирования, кто-то станет вторым Ильяховым, а кто-то, возможно, и Маском.
А вы? Вы все так же будете вводить капчу.
Если не капча, то что
Если вы хотите зарабатывать в интернете, но не знаете, с чего начать, то вот вам подборка наших статей про заработок.
Еще есть статьи по направлениям «копеечного фриланса». Я ни одно из этих направлений вам не рекомендую, потому что нормальных денег там заработать нельзя. Но для ознакомления советую все-таки почитать:
Заключение
Вот мы и поговорили о том, что такое капча. Понятно ли вам теперь, для чего она нужна и почему нам с вами иногда приходится пристально-пристально всматриваться в картинку, чтобы все-таки понять, что на ней изображено?
Если остались какие-то вопросы по статье – присылайте их в комментариях. Обязательно отвечу.