Пыхтел, пытался и теперь я первый ) значит забираем...

Пыхтел, пытался и теперь я первый ) значит забираем Ютуб под себя и дальше

Кстати, лучше источника трафика чем Ютуб нет. Просто не существует. ТикТок? Да нет, качество аудитории с Ютубом не сравнится.
Оставить комментарий

03 февраля 2023 0 48

Пятничный мем

Пятничный мем

Выбирай инфопродукты полностью белая вертикаль без банов, треша и прочих рисков!

Всем хороших выходных!

#мем
Оставить комментарий
03 февраля 2023 7 101

Как запретить ChatGPT использовать контент вашего сайта

В среде вебмастеров появилась резонная обеспокоенность по поводу того, как запретить большим языковым моделям (LLM), таким как ChatGPT, использовать контент сайтов для обучения. Способ сделать это есть, но он не очевидный и работает не со 100% гарантией.

А спонсором блога в этом месяце выступает сервис Rookee. Когда требуется комплексное поисковое продвижение, реклама в Telegram или формирование репутации в интернете – на помощь приходят Rookee!

Как ИИ обучается на вашем контенте

Большие языковые модели (LLM) обучаются на данных, которые поступают из различных источников. Многие из этих наборов данных имеют открытый исходный код и свободно используются для обучения ИИ.

Некоторые из таких источников:

  • Википедия;
  • государственные документы;
  • книги;
  • электронные письма;
  • просканированные веб-сайты.

В интернете существуют порталы и сайты, предлагающие наборы данных, которые предоставляют огромное количество информации. Один из таких порталов хостится на Amazon и предлагает тысячи наборов данных: Registry of Open Data on AWS.

Портал Amazon с тысячами наборов данных – это всего лишь один источник из множества других, содержащих ещё больше наборов данных. В Википедии перечислены 28 таких источников для загрузки наборов данных, включая порталы Google Dataset и Hugging Face, на которых можно найти тысячи датасетов.

Наборы данных веб-контента

OpenWebText

OpenWebText – это одна из популярных баз данных веб-контента. Она состоит из URL-адресов, найденных в сообщениях Reddit, которые имеют не менее трёх голосов (лайков).

Идея заключается в том, что эти URL заслуживают доверия и содержат относительно качественный контент. Я не смог найти информацию про user-agent этого краулера, возможно, он идентифицируется, как Python.

Тем не менее, известно, что если на ваш сайт есть ссылка с Reddit, по крайней мере, с тремя лайками, то велика вероятность того, что ваш сайт есть в наборе данных OpenWebText.

Common Crawl

Один из наиболее часто используемых наборов данных о содержимом интернета предлагается некоммерческой организацией под названием Common Crawl. Данные Common Crawl поступают от бота, который просматривает весь интернет.

Информация загружается компаниями, желающими использовать её, а затем очищаются от спамерских сайтов и тому подобных сущностей.

Имя бота Common Crawl – CCBot. Он подчиняется протоколу robots.txt, поэтому его можно заблокировать с помощью соответствующей директивы и предотвратить попадание данных вашего сайта в очередной датасет.

Если ваш сайт уже был просканирован, то, скорее всего, он уже включён в несколько наборов данных. Однако, блокируя Common Crawl, можно отказаться от включения контента вашего сайта в новые наборы данных в будущем.

CCBot User-Agent:

CCBot/2.0

Добавьте следующие строки в ваш файл robots.txt, чтобы заблокировать бота Common Crawl:

User-agent: CCBot
Disallow: /

Дополнительным способом подтверждения легитимности пользовательского агента CCBot является то, что он осуществляет поиск с IP-адресов Amazon AWS.

CCBot также подчиняется директивам nofollow мета-тега robots.

Используйте следующую конструкцию для мета-тега robots:

Блокировка использования искусственным интеллектом вашего контента

Поисковые системы позволяют веб-сайтам отказаться от участия в краулинге. Common Crawl также позволяет отказаться от этого. Однако в настоящее время не существует способа удалить контент вашего сайта из уже существующих наборов данных.

Более того, учёные-исследователи в принципе не предлагают сейчас вебмастерам возможности отказаться от использования их контента. В связи с этим назревает закономерный вопрос: «Насколько этично использовать, например, ChatGPT, данные веб-сайтов без разрешения или возможности отказаться от этого?»

Думаю, многие вебмастеры будут очень даже не против, если в ближайшем будущем им предоставят больше прав в отношении того, как используется их контент, особенно всевозможными сервисами на основе нейросетей, такими как ChatGPT.

А вы что думаете по этому поводу? Согласны ли отдавать свой контент бесплатно ИИ-инструментам для того, чтобы они на нём обучались, а потом брали со своих пользователей деньги за генерацию аналогов? Делитесь мнениями в комментариях!

Сообщение Как запретить ChatGPT использовать контент вашего сайта появились сначала на Блог SEO-аспиранта.

Показать все 7 комментариев Скрыть 5 комментариев
Дмитрий

Это же бред, кому нах нужен твои сайт или мой, это капля в море она еичего не решает, там википедия сканируется, тысячи книг, а наши ГС нах не всрались никому, кроме нас!

03 февраля 2023, 18:06 0
seoonly.ru

ну пусть себе используют)

04 февраля 2023, 07:51 0
Аспирант

В ответ на Дмитрий.

В интернете есть разные типы информации. Например:

Базовая теория (почему вода синяя, что такое параллелограмм), под которую горе-вебмастеры клепают тысячи бесполезных статейников, действительно есть в Википедии.

А вот полезные практические знания, личный опыт и тому подобная информация – это результаты труда конкретного человека, считай, его интеллектуальная собственность. И вот тут уже большой вопрос, согласишься ли ты отдавать такую информацию на чужие сайты, бесплатно.

04 февраля 2023, 11:59 0
Аспирант

В ответ на seoonly.ru.

Как скажешь. =)

04 февраля 2023, 11:59 0
Владислав

Что за двойные стандарты? Тогда уж и вы не используйте нейросети, если планируете закрывать от них контент. А то блага получать – хочу, а делиться чем-то за эти блага – не хочу. Некрасиво поступаете.

04 февраля 2023, 12:16 0
Аспирант

В ответ на Владислав.

А я и не планирую ничего закрывать. =)

Профессиональные дорвейщики наполняли Сеть подобным контентом (“неверным, вводящим в заблуждение, оскорбительным, предвзятым” – как пишет о результатах своего творения сам ChatGPT) годами. И будут продолжать это делать, эксплуатируя алгоритмы поисковых систем и зарабатывая на этом деньги.

Думаю, отчасти и поэтому бот не может выдавать достоверную информацию.

04 февраля 2023, 12:22 0
Ельвира

За информацию спасибо! Получается, не зря последние годы пользовалась https://seo-zona.ru/badbo... (уминаемый в статье бот отнесен к потенциально бесполезным)

04 февраля 2023, 15:43 0
Оставить комментарий

Угадайте, что за кабинет на скрине?)

Угадайте, что за кабинет на скрине?)

Так теперь выглядит новая платформа VK ADS, объединяющая рекламу во всех проектах ВК, включая Одноклассники.

Лучше или хуже? Пока не знаю, но видимо, под новую платформу выделили отдельный аукцион, который пока не забит, а значит стоимость за 1000 показов ниже, чем в старом рекл. кабе ВК!

В будущем ВК откажется от старого рекл кабинета ВК и от Mytarget в пользу новой единой платформы.

P.S.: Пошёл тестить новый-старый источник.
Прочитать подробности от тех, кто уже протестил, можно в [https://vk.com/wall-131101936_371477Targethunter], скрин оттуда же.
Оставить комментарий

03 февраля 2023 0 12

Как продвигать сообщества ВКонтакте с большей эффективностью...

Как продвигать сообщества ВКонтакте с большей эффективностью и инструментами автоматизации? Узнайте на вебинаре VK Рекламы 9 февраля 17:00 (МСК).

Зачем приходить на эфир?
расскажем, как продвигать существующее сообщество или создать новое прямо из рекламного кабинета;
научим оптимизировать рекламу на доступные целевые действия: вступить в сообщество, написать в сообщество, повышение вовлеченности или покупка товаров и услуг;
рассмотрим, как ускорить запуск рекламы с помощью инструментов автоматизации;
поделимся, как сэкономить на создании видео и текстов объявлений;
покажем, как увеличить количество подписчиков, охват и вовлеченность в рамках привычного бюджета.

Оставляйте вопросы под постом и подключайтесь к прямому эфиру 9 февраля 17:00 по московскому времени.

Зарегистрируйтесь, чтобы не пропустить: https://vk.cc/cli2Ct
Оставить комментарий

03 февраля 2023 0 433

Доход от беттинга в Дании снизился несмотря на ЧМ по...

Доход от беттинга в Дании снизился несмотря на ЧМ по футболу Ставки на спорт в 2022 году принесли всего $339 миллиона дохода. И это немного удивительно, учитывая проведение Чемпионата Мира в декабре. Можно предположить, что подвели первые три квартала, а ЧМ наоборот «вытащил» ситуацию, но нет. Согласно декабрьскому отчету, прибыль от ставок на спорт во время ЧМ составила всего $19,8 миллионов. В декабре сегмент беттинга показал снижение на 35% . Более того, декабрь 2022 года признан самым слабым по доходам с октября 2021 года. Зато в отчете регулятора упоминается об игровых автоматах, которые принесли в 2022 году доход $168,1 миллиона, что значительно превышает показатель предыдущего года. Вы там пока запускались на Бразилию все дружно забыли про Данию? Беттинг [Партнеркин] 👈
Оставить комментарий

РСЯ порезал доходы нерезидентам

В телеграм-канале РСЯ под последней новостью интересная дискуссия разразилась. У всех, у кого договор заключался на нерезидента, доход просел в несколько раз. Ответ от партнерки на скрине.

Также правильные мысли сквозят и в комментах. В общем дело в том, что Яндекс отключил показ рекламы российских рекламодателей для владельцев нерезидентов, остались только иностранные реклы из “дружественных стран”, а их как вы понимаете с гулькин детородный орган. Таким образом, все нерезиденты остались считай без дохода с РСЯ.

Пока вижу выход из ситуации – сделать самозанятость и оформить вывод денег на карту самозанятого российского банка. Самозанятость оформляется в 2 клика. Однако, неизвестно поможет ли, когда уже знают, что вы нерезидент. Тогда идем дальше…или на родственников оформить ИП или ту же самозанятость и туда отправлять деньги.

Источник: vysokoff.ru.

seoonly.ru

вот жучары

04 февраля 2023, 07:49 0
сева

ещё варианты
+найти кого то в РФ (резидента РФ) и на него оформить договор РСЯ
+повесить рекламу Карамель / adfinity / market-place.su / …

09 февраля 2023, 17:48 0
Оставить комментарий

03 февраля 2023 0 14

БРЕД КАКОЙ-ТО

БРЕД КАКОЙ-ТО

В общем я прям возмущен. Возмущен новым кабинетом и тем как нас туда заманивают)) В старом кабе мне подписчик в мой паблик выходит около 70-100р. Целевой по ключевому слову

Та же аудитория, короче даже крео такое же в новом кабе мне подписчика дает по 4р!!!!

Почти в 25 раз дешевле!

У меня тут закрадываются сомнения в том, что в новом кабе вк просто льет воду и рисует красивые цифры, чтобы все такие воооо туда нам надо!

Но пообщавшись с коллегами, некоторые говорят, что такие подписчики очень плохого качества(!) Мол выгоднее лить со старого, подписок меньше, но качество лучше

Я пока что не знает как к этому относиться. Но такое чувство, что меня обманывают и пытаются красивыми цифрами заманить в какой-то капкан

Что скажешь? Лил уже там?

Я еще лид формы непробовал - за это вообще очкую))

ПС: А ну и еще ндс 20% - это вообще кайф)
ПС2: и настройки аудиторий вообще дно

АП! Вк насчитал 11 подписок, из которых 6 отписались)) Ну че это похоже на правду о качестве трафика)) ЛАдно посмотрим дальше что будет
Оставить комментарий

02 февраля 2023 0 25

На что лить с ТикТок?

На что лить с ТикТок?

Один из популярнейших источников трафика, о принципах работы с которым мы подробно писали в нашей статье: https://vk.cc/cgdfFr

Для наших партнеров подготовили большой список офферов в трендовых нишах и ГЕО для работы!

- 21909 - Desintox - COD - [PL] - $21 (Parasites)- https://vk.cc/clg80u
- 22438 - Flexio - COD - [PE] - $15 (Joints)- https://vk.cc/clg86W
- 22417 - Keratinorm - COD - [MX] - $11 (Hair)- https://vk.cc/clg8cx
- 21887 - Biolica - COD - [MX] - $16 (Weight loss)- https://vk.cc/clg8hM
- 21757 - BioForce - COD - [CL] - $20 (Joints)- https://vk.cc/clg8mk
- 21562 - Lavite - COD - [MY] - $17 (Anti-aging)- https://vk.cc/clg8r7
- 22406 - Bonivita - COD - [MY] - $18 (Joints)- https://vk.cc/clg8wO
- 20380 - Zenza - COD - [AR] - $14 (Anti aging)- https://vk.cc/clg8BG
- 21014 - Hairluxe - COD - [AR] - $13 (Hair)- https://vk.cc/clg8Pn
- 21015 - Variquit - COD - [AR] - $13,5 (Varicose)- https://vk.cc/clg8X8
- 21240 - Sex up - COD - [AR] - $13,5 (Enlargement)- https://vk.cc/clg91c
- 20381 - Enerflex - COD - [AR] - $14 (Joints)- https://vk.cc/clg95H
- 22474 - Vitafit - COD - [VN] - Private
- 21582 Luxerin - COD - [TH] - Private

Больше информации по офферам можно узнать, написав личному менеджеру или перейдя на dr.cash!
Оставить комментарий

02 февраля 2023 0 477

У селлеров аккаунтов Netflix новая проблема, а владельцам...

У селлеров аккаунтов Netflix новая проблема, а владельцам пиратских кинотубов плюс к трафику — Netflix обяжет юзеров раз в месяц подключаться к основному Wi-Fi Так компания хочет бороться с передачей паролей. Аккаунты по-прежнему можно делать общими. Для этого пользователи разных устройств каждый 31 день должны подключаться к сети Wi-Fi владельца аккаунта и затем включить любой фильм. Подписчики, которые смотрят Netflix вне дома, смогут запрашивать временный код, который предоставит доступ к их аккаунту в течение семи дней. Netflix используют IP-адреса, идентификаторы устройств и активность аккаунтов, чтобы выявить, подключён ли человек к основной сети владельца профиля. Компания уже долгое время борется с шерингом паролей. Почва для пиратских сайтов становится еще более благоприятной. Сокращение библиотеки «Кинопоиска», «гайки» Netflix и вот пользователь уже гуглит: «Смотреть кино онлайн без регистрации». E-commerce [Партнеркин] 👈
Оставить комментарий