Яндекс и уникализация картинок

А ведь все начиналось хорошо.
Но потом пришел Finrod, и тонко намекнул, что копипастные картинки на сайте — это совсем не здорово.
Не только с точки зрения авторства, но и с точки зрения поисковика.

Этот момент заставил меня призадуматься.
В результате я учинил нехилое расследование, и провел ряд практических экспериментов, которые были совсем неутешительны.

Но обо всем по порядку.

Тут такое дело: об этих самых картинках — я до сего дня как-то вообще не задумывался. Потому что основное содержимое этого блога — это тексты. Которые я пишу собственноручно.
А картинки тут — постольку-поскольку.
Есть картинка — хорошо.
Нету картинки — да и хрен-то с ней.
Об уникальности картинок речи вообще не шло.
(Также как и о продвижении блога в топ поиска по этим самым картинкам. Что вообще-то не совсем нормально).

Но раз уж всплыл такой вопрос — начал поиск. Как известно, если забить в гугла что-нибудь про уникальность и про контент — он неизбежно забросит вас в главное гнездовье сеорастов.
И запрос «уникализация картинок» тут не исключение.
Ткните его в гугла.
И окажетесь на серче.

О том, сколь «полезны» бывают форумы — я уже писал. Сегодня я просто получил лишнее тому подтверждение. Масса людей рассуждает про эту самую уникализацию картинок.
Каждый при этом делает серьезную рожу, и с умным видом начинает рассуждать про преобразования Фурье, про нейронные сети, про теорию графов, и про хрен знает что еще.
И все это вместо того, чтобы просто признать: мы — не знаем, как поисковик находит дубликаты картинок. Мы — не знаем, чем он руководствуется при нахождении дублей, и какие правила он при этом применяет. А все, что мы здесь понаписали — не более чем словесный понос, и гадание на кофейной гуще.

Если сильно надо — то вот, можете причаститься:

http://forum.searchengines.ru/showthread.php?t=319514
http://forum.searchengines.ru/showthread.php?t=418224
http://forum.searchengines.ru/showthread.php?t=441347

Чем больше я все это читал, тем больше понимал: ничего определенного тут найти не удастся. И единственным разумным решением будет поискать официальные высказывания самих яндексоидов относительно уникализации картинок и механизма поиска по картинкам.

Археологическое гугление привело меня к сообщению двухгодичной давности, которое было вывешено на хабре. Дословно там говорилось вот это:

Для поиска дубликатов мы строим относительно компактные сигнатуры картинок, в основе которых распределение яркостей и цветов по площади изображения, а также некоторые другие признаки. Выбор данных для включения в сигнатуру зависит от самой картинки, в разных классах изображений отдельные виды сигнатур работают с переменным успехом. Сигнатуры укладываются в индексы сложной структуры для нечеткого поиска. В частично кластеризованном виде эти индексы удается загрузить в память.

http://habrahabr.ru/company/yandex/blog/43141/

О том, что это за «некоторые другие признаки», история, конечно же, умалчивает. Но это все, что мне удалось разыскать. Переходим к практической части.

Как сделать картинку уникальной?

Для примера — я взял пару картинок. Одна из них — висит в посте про минусы зоны .рф, вторая — в посте про поисковые запросы.
Я взял эти картинки, и оттащил на проверку в тинай (www.tineye.com).
Если кто не в курсе, тинай — это нечто вроде сервиса copyscape.
Только копискайп ищет похожие тексты, а тинай — ищет похожие картинки.
И ищет он их, надо отметить, очень и очень лихо.
Для первой картинки нашлось 7 результатов:

Зона РФ

Для второй картинки с красивой тетей в гугловой маечке — нашлось аж целых 300 результатов:

Google girl

Запомнили циферки?
Это хорошо.

А теперь запомните еще одну вещь: никакие извращения не сделают эти картинки уникальными.

  • Вы можете сменить расширение картинок.
  • Вы можете изменить их размер.
  • Вы можете вырезать из них куски.
  • Вы можете их отзеркалить.
  • Вы можете навесить на них надписи, водяные знаки, рамки, и хрен знает что еще.
  • Вы можете слегка растянуть картинки (скажем, по ширине).
  • Вы можете слегка повернуть картинки (скажем, градусов на десять-двадцать).
  • Вы можете сотворить какое-нибудь непотребство с цветом — сделать картинку негативной, монохромной, размытой или еще черт знает какой.
  • Наконец, вы можете сотворить все вышеперечисленное разом.

Все, чего вы добьетесь — это незначительное уменьшение количества копий, которые видит тинай.

Oh shi~

Было 7? Станет 4. Или 2.
Было 300? Станет 286.
Или в лучшем случае — 243.

Но копии — останутся все равно.
Поверьте. Я знаю.

Единственный способ сделать эти картинки полностью уникальными — это повернуть их на 90 градусов.

Примерно вот так:

Уникальная картинка 1

Или вот так:

Уникальная картинка 2

Но кому будут нужны такие картинки — большой вопрос.

P.S. И все же мне удалось решить проблему с уникализацией картинок. Но это уже совсем другая история.



Запись опубликована в рубрике SEO. Добавьте в закладки постоянную ссылку.

7 комментариев на «Яндекс и уникализация картинок»

  1. Finrod говорит:

    А что, способ. Для некоторых простых картинок может и подойти. Спасибо за исследование;)

  2. admin говорит:

    Проверено: картинки с мячами и елочными шариками — уникализируются без потери качества. Почти. 🙂

  3. Master-bo.ru говорит:

    Спасибо за проведенную работу и ссыль на сервис для проверки уникальности, пригодится 🙂

  4. admin говорит:

    На здоровье.

  5. Bon говорит:

    Только что проверил через этот (www.tineye.com)кучу фоток награбленных на американских сайтах и размещенных на своём блоге — 0 Results.

    Я их в новом оригинальном Фотошопе обрабатывал, совсем слегка.

  6. Bon говорит:

    Как оказалось — не всё так радужно, как я написал в предыдущем комментарии. В ходе дальнейшей проверки этот сервис всё-таки нашёл реальные дубликаты к нескольким картинкам, расположенным на моём блоге.

  7. admin говорит:

    Его не так-то просто обмануть, этот сервис.

Обсуждение закрыто.