151.BG
  • Начало
  • Категории
    • Бизнес услуги
    • Детегледачки
    • Лечебни масажи
    • Монтаж на мебели
    • Озеленяване
    • Професионално почистване
    • Сезонни услуги
    • Спешни услуги
    • Строителни ремонти
    • Транспортни услуги
    • Уеб разработка, маркетинг и дизайн
  • Най-търсено
    • Отпушване на канали
    • Ремонт на покриви
    • ВиК услуги
    • Ремонт на бани
    • Хидроизолация с течна гума
    • Електро услуги
    • Монтаж на мебели
    • Кърти чисти извозва
    • Довършителни ремонти
    • Смяна на ел табло
  • Ценова листа
  • Присъединяване
  • Изпрати запитване
  • Menu Menu

Начало » Интересно » Отравяне на данни: творци саботират генеративните AI

Отравяне на данни: творци саботират генеративните AI

Отравяне на данни: творци саботират генеративните AI
  • Share on Facebook
  • Share on X
  • Share on LinkedIn
Време за четене: 4 минути

Дата: 02.02.2024

Съдържание:

  1. Какво е „отравяне на данни“?
  2. И ето откъде идва идеята за „отравяне“
  3. Симптоми на отравяне
  4. Има ли противоотрова?
  5. Одитите също са възможно средство
  6. Стратегии срещу технологиите

Безразборното използване на картини и снимки от интернет за обучение на AI модели доведе до отпор: отравянето на данните. Проблемът опира до зачитане на моралните права на авторите и потребителите.

Отравянето на данни в големите генеративни AI модели става все по-осезаем проблем. Може би ще се намерят технологични решения за предпазване от подобна манипулация, но по-важното е разработчиците на технологията да осъзнаят проблема от гледна точка на моралните права – и на авторите, и на потребителите.

Представете си, че имате нужда от изображение на балон за своя работна презентация. Насочвате се към генератор на изображения от текст, например Midjourney или DALL-E. Въвеждате подканата: „червен балон на фона на синьо небе“. Генераторът връща изображение на яйце. Опитвате отново, но този път генераторът изплюва картинка с пъпеш. Какво става тук? Генераторът, който използвате, може да е бил „отровен“.

Какво е „отравяне на данни“?

Генераторите на изображения от текст работят, като се обучават върху големи набори от данни, включващи милиони или милиарди изображения. Някои генератори, като тези, предлагани от Adobe или Getty, се обучават въз основа на изображения, които производителят на генератора притежава – или най-малкото има лиценз за използването им.

Но други генератори биват обучени чрез безразборно преравяне на изображения из интернет. А много от тях са защитени с авторски права. Тенденцията доведе до редица случаи на нарушаване на авторските права, при което художници и фотографи започнаха да обвиняват големите технологични компании в кражба и печалба от работата им.

И ето откъде идва идеята за „отравяне“

Изследователи, които искат да дадат възможност на творците да предприемат нещо, наскоро създадоха инструмент, наречен „Nightshade“, за да се борят срещу нелегалното преравяне на изображения. Инструментът работи, като фино променя пикселите на изображението по начин, който причинява хаос в работата на компютърното зрение, но все пак оставя изображението непроменено за човешкото око.

Ако след това дадена организация използва някое от тези изображения, за да обучи бъдещ AI модел, нейният пул от данни става „отровен“. Това може да доведе дотам, че алгоритъмът да се научи погрешно да класифицира изображението. В резултат, генераторът може да започне да връща некоректни, непредвидими и – очевидно – нежелани резултати.

Симптоми на отравяне

Един балон може да се окаже яйце. Заявка за изображение в стила на Моне може да върне изображение в стила на Пикасо.

Възможно е да се върнат някои от проблемите с по-ранните AI модели, като дефектите при точното изобразяване на ръце, например. Моделите могат да въведат и други странни и нелогични характеристики в изображенията – примерно кучета с по шест крака.

СИФ гледа на генеративния AI като на топ-риск Колкото по-голям е броят на „отровените“ изображения в данните за обучение, толкова по-голямо е смущението. Поради начина, по който работи генеративният изкуствен интелект, щетите от „отровени“ изображения засягат и ключовите думи в свързаните „подкани“.

Например, ако в данните за обучение се използва „отровено“ изображение на спортен автомобил от една марка, то резултатите за други марки автомобили и също могат да се окажат „оплескани“, а даже и резултатите относно други термини, свързани с автомобилизма.

Разработчикът на „Nightshade“ се надява, че инструментът ще накара големите технологични компании да се замислят и да зачитат по-сериозно авторските права. Но също така е възможно потребителите да започнат злоупотребяват с инструмента и умишлено да качват „отровени“ изображения в генераторите, за да се развалят качеството на услугите им.

Свързани публикации: ИЗОБРАЖЕНИЯ, ГЕНЕРИРАНИ ОТ AI: БАЛАНСИРАНЕ НА РЕАЛИЗМА И ОТГОВОРНОСТТА В ЕРАТА НА ТЕХНОЛОГИИТЕ >>>>

Има ли противоотрова?

Като реакция на случващото се някои специалисти предложиха набор от технологични и чисто човешки решения. Най-очевидното е да се обръща по-голямо внимание на това откъде идват входните данни и какви са правата за тяхното използване. Това би трябвало да доведе до по-малко безразборно събиране на данни.

Подходът е в разрез с убеждението, което битува сред някои компютърни специалисти: че данните, намерени онлайн, могат да се използват за всякакви цели, които те смятат за подходящи.

Друго технологично решение е използването на „ансамблово моделиране“, където различни модели се обучават върху много различни подмножества от данни и се сравняват, за да се открият специфични отклонения. Този подход може да се използва не само за обучение, но и за откриване и изхвърляне на предполагаеми „отровени“ изображения.

Одитите също са възможно средство

Прилагането на одит означава разработване на „тестова батерия“ – малък, добре подбран и добре етикетиран набор от данни – като се използват „задържащи“ данни, които никога не се използват за обучение. След това въпросният набор може да се използва за проверка на точността на модела.

Стратегии срещу технологиите

Така наречените „враждебни подходи“ (тези, които влошават, мамят или манипулират AI системи), включително отравянето на данни, не са нищо ново. Те могат да включват и използването на грим и костюми за мамене на системите за лицево разпознаване.

Активистите за правата на човека, например, са загрижени за безразборното използване на машинно зрение на обществени места. Тази тревожност е особено остра по отношение на разпознаването на лица. Системи като Clearview AI, която поддържа масивна база данни с възможност за търсене на лица, извлечени от интернет, се използват от правоприлагащите органи и правителствените агенции по целия свят. През 2021 г. обаче правителството на Австралия призна, че Clearview AI нарушава поверителността на гражданите.

Като част от съпротивата срещу системите за лицево разпознаване, използвани за профилиране на конкретни лица, някои художници дори измислиха мамещи модели на грим и дрехи с назъбени цветови линии и асиметрични криви, които пречат на системите за наблюдение да ги идентифицират.

Има ясна връзка между тези случаи и проблема с отравянето на данни. И двата са свързани с по-съществени въпроси относно управлението на технологиите. Много доставчици на технологии биха счели отравянето на данни за досаден проблем, който трябва да бъде коригиран с технологични решения. Но може би все пак е по-добре да разглеждаме отравянето на данни от гледна точка на основните морални права на творците и потребителите.

3.6/5 - (446 votes)
Беше ли полезна тази публикация?
1449
262

Разгледайте други публикации

Отравяне на данни: творци саботират генеративните AI

Подобрение в Android 14 прави системата по-бърза

Google въвежда подобрение в Android 14, които увеличават производителността и живота на батерията на устройствата. Намалява се фоновата активност и се оптимизират комуникациите при критични събития.

Отравяне на данни: творци саботират генеративните AI

Излиза платен Chrome с AI функции за бизнес потребители

Платена версия на браузъра Chrome ще предложи повишена сигурност с AI функции на корпоративните клиенти. Компаниите могат да го ползват срещу такса от 6 долара месечно за всеки потребител.

0 replies

Leave a Reply

Want to join the discussion?
Feel free to contribute!

Вашият коментар Отказ

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

Последни публикации

  • Ремонт на Кухня: 13-те Най-Чести (и Скъпи) Грешки и Как Професионалистите ги Избягват
    Ремонт на Кухня: 13-те Най-Чести (и Скъпи) Грешки и Как Професионалистите ги Избягват
  • Преустройство на Апартамент: Ръководство за Законно Усвояване на Тераса
    Преустройство на Апартамент: Ръководство за Законно Усвояване на Тераса
  • Как да планирате бюджета за цялостен ремонт на апартамент през 2025 г.: Пълно ръководство от А до Я
    Как да планирате бюджета за цялостен ремонт на апартамент през 2025 г.: Пълно ръководство от А до Я
  • Основен ремонт на баня през 2025: Пълно ръководство в 10 стъпки
    Основен ремонт на баня през 2025: Пълно ръководство в 10 стъпки
  • PVC, алуминий или дърво? Направете информиран избор за дограма през 2025
    PVC, алуминий или дърво? Направете информиран избор за дограма през 2025

Реклама

  • Технически надзор на ремонт
  • Видеодиагностика на канали
  • Монтаж на душ панел
  • Смяна на щрангове
  • Монтаж на тоалетна чиния
  • ВиК услуги Бургас
  • ВиК услуги Перник
  • ВиК услуги в Пловдив
  • ВиК услуги Стара Загора
  • ВиК услуги Варна
  • Водопроводчик Дружба
  • Водопроводчик Люлин
  • Водопроводчик Обеля
  • Водопроводчик Младост
  • Водопроводчик Надежда
  • Водопроводчик в Овча купел
  • Водопроводчик Слатина
  • Водопроводчик Студентски град
  • Термография на фотоволтаици
  • Отпушване на канали в Пловдив
Цялото съдържание е под защита на авторското право © 2011-2025. 151.bg
  • За нас
  • Реклама
  • Партньорство
  • Поверителност
Scroll to top Scroll to top Scroll to top