AI за динозаври

Всичко, което трябва да знаете за AI - за по-малко от 8 минути.

Да знаеш малко за всичко често е по-добре, отколкото да притежаваш едно експертно умение. Това важи особено за хората, влизащи в дебата на развиващите се пазари. Най-вече технологиите.

Повечето хора смятат, че знаят малко за AI. Но полето е толкова ново и се разраства толкова бързо, че сегашните експерти ежедневно разбиват нови позиции. Има толкова много наука за разкриване, че технолозите и политиците от други области могат да допринесат бързо в областта на ИИ.

Ето откъде идва тази статия. Целта ми беше да създам кратка справка, която да приведе технически настроените хора да ускорят бързо с AI термини, език и техники. Надяваме се, че този текст може да бъде разбран от повечето непрактикуващи лекари, като същевременно служи за справка за всички.

Въведение

Изкуственият интелект (AI), дълбокото обучение и невронните мрежи са термини, използвани за описване на мощни техники, базирани на машинно обучение, които могат да решат много проблеми в реалния свят.

Въпреки че дедуктивните разсъждения, заключенията и вземането на решения, сравними с човешкия мозък, са малко назад, има много скорошни постижения в техниката на ИИ и свързаните с тях алгоритми. Особено с нарастващата наличност на големи масиви от данни, от които AI може да се научи.

Полето на AI обхваща много области, включително математика, статистика, теория на вероятностите, физика, обработка на сигнали, машинно обучение, компютърни науки, психология, лингвистика и невронаука. Проблемите около социалната отговорност и етиката на AI правят паралели с много клонове на философията.

Мотивацията за по-нататъшно усъвършенстване на AI техники е, че решенията, необходими за решаване на проблеми с много променливи, са невероятно сложни, трудни за разбиране и не е лесно да се съберат ръчно.

Все по-често корпорациите, изследователите и хората разчитат на машинно обучение за решаване на проблеми, без да изискват подробни инструкции за програмиране. Този подход на черна кутия за решаване на проблеми е критичен. Човешките програмисти намират за все по-сложно и отнема време да пишат алгоритми, необходими за моделиране и решаване на големи проблеми с данни. Дори когато създаваме полезна рутина за обработка на големи масиви данни, тя е изключително сложна, трудна за поддържане и невъзможна за адекватно тестване.

Съвременното машинно обучение и AI алгоритмите, заедно с правилно обмислените и подготвени данни за обучение, са в състояние да направят програмирането за нас.

Преглед

Интелигентност: способността да се възприема информацията и да се запази като знание, което да се прилага към адаптивно поведение в среда или контекст.

Това определение на интелигентността в Wikipedia може да се прилага както за органични мозъци, така и за машини. Интелигентността не предполага съзнание, често срещано погрешно схващане, разпространено от писатели на научна фантастика.

Потърсете примери за AI в интернет и ще видите препратки към IBM Watson. Алгоритъм за машинно обучение, който стана известен с победата в шоуто за телевизионна викторина Jeopardy през 2011 г. Оттогава той е преназначен и използван като шаблон за разнообразен набор от търговски приложения. Apple, Amazon и Google работят усилено, за да получат подобна система в нашите домове и джобове.

Обработката на естествен език и разпознаването на реч бяха първите търговски приложения на машинното обучение. Следват внимателно от други автоматизирани задачи за разпознаване (модел, текст, аудио, изображение, видео, лицеви, ...). Обхватът на приложенията се разраства и включва автономни превозни средства, медицински диагнози, игри, търсачки, филтриране на спам, борба с престъпления, маркетинг, роботика, дистанционно проучване, компютърно зрение, транспорт, разпознаване на музика, класификация ...

AI стана толкова вграден в технологията, която използваме, сега не се възприема от мнозина като „AI“, а просто разширение на изчислителната техника. Попитайте някого на улицата дали има AI на телефона си и той вероятно ще каже „не“. Но алгоритмите на AI са вградени навсякъде от предсказуем текст до системата за автоматично фокусиране в камерата. Общото мнение е, че AI все още не е пристигнал. Но сега е тук и е от известно време.

AI е доста обобщен термин. Фокусът на повечето изследвания е малко по-тясното поле на изкуствените невронни мрежи и задълбоченото обучение.

Как работи мозъкът ви

Човешкият мозък е изящен въглероден компютър, който се изчислява да извършва милиард милиарди изчисления в секунда (1000 петафлопа), като същевременно консумира около 20 вата енергия. Китайският суперкомпютър Tianhe-2 (като време на писане на най-бързите в света) управлява само 33 860 трилиона изчисления в секунда (33,86 петафлопа) и консумира 17600000 вата (17,6 мегавата). Имаме някакъв път, преди нашите силициеви творения да изравнят въглеродните еволюции.

Точният механизъм, който мозъкът използва, за да изпълнява мисленето си, е предназначен за дебати и по-нататъшно изучаване (харесвам теорията, че мозъкът използва квантови ефекти, но това е друга статия). Вътрешните работи обаче често се моделират около концепцията за невроните и техните мрежи. Смята се, че мозъкът съдържа около 100 милиарда неврони.

Невроните взаимодействат и комуникират по пътища, позволяващи да се предават съобщения наоколо. Сигналите от отделни неврони се претеглят и комбинират, преди да се активират други неврони. Този процес на съобщения, които се предават наоколо, комбиниране и активиране на други неврони се повтаря през слоеве. В рамките на 100 милиарда неврони в човешкия мозък сумирането на тази претеглена комбинация от сигнали е сложно. И това е значително подценяване.

Но не е толкова просто. Всеки неврон прилага функция или трансформация към своите претеглени входове преди тестване, ако е достигнат праг на активиране. Тази комбинация от фактори може да бъде линейна или нелинейна.

Първоначалните входни сигнали произхождат от различни източници ... нашите сетива, вътрешен мониторинг на телесните функции (ниво на кислород в кръвта, стомашно съдържание ...). Един неврон може да получи стотици хиляди входни сигнали, преди да реши как да реагира.

Мисленето или обработката и получените в резултат на това инструкции на нашите мускули са сумирането на входните сигнали и контурите за обратна връзка в много слоеве и цикли на невронната мрежа. Но невронните мрежи на мозъка също се променят и актуализират, включително модификации на размера на теглото, приложено между невроните. Това се причинява от учене и опит.

Този модел на човешкия мозък е използван като шаблон за подпомагане на възпроизвеждането на възможностите на мозъка в компютърна симулация ... изкуствена невронна мрежа.

Изкуствени невронни мрежи (ANNs)

Изкуствените невронни мрежи са математически модели, вдъхновени и моделирани върху биологични невронни мрежи. ANN са в състояние да моделират и обработват нелинейни връзки между входовете и изходите. Адаптивните тегла между изкуствените неврони се настройват от алгоритъм за учене, който чете наблюдаваните данни с цел подобряване на изхода.

Използват се техники за оптимизация, за да се направи възможно решение ANN да бъде възможно най-близко до оптималното. Ако оптимизацията е успешна, ANN е в състояние да реши конкретния проблем с висока производителност.

ANN се моделира, като се използват слоеве неврони. Структурата на тези слоеве е известна като архитектурата на модела. Невроните са индивидуални изчислителни единици, способни да приемат входни данни и прилагат математическа функция, за да определят дали съобщенията се предават заедно.

При обикновен трислоен модел първият слой е входният слой, последван от един скрит и изходен слой. Всеки слой може да съдържа един или повече неврони.

Тъй като моделите стават все по-сложни, с повече слоеве и повече неврони, техните възможности за решаване на проблеми се увеличават. Ако моделът е твърде голям за дадения проблем, тогава моделът не може да бъде оптимизиран ефективно. Това е известно като преизпълнение.

Основната архитектура и настройка на модела са основните елементи на ANN техниките, заедно с алгоритмите за обучение за четене в данните. Всички компоненти носят производителността на модела.

Моделите обикновено се характеризират с функция за активиране. Това се използва за преобразуване на претегления вход на неврон в неговото изходно активиране. Има селекция от трансформации, които могат да се използват като функция за активиране.

ANN могат да бъдат изключително мощни. Въпреки че математиката на няколко неврона е проста, цялата мрежа се увеличава, за да стане сложна. Поради това ANNs се считат за алгоритми на „черна кутия“. Изборът на ANN като инструмент за решаване на проблем трябва да се извършва внимателно, тъй като не е възможно да се премахне процеса на вземане на решения в системата по-късно.

Снимка на Патрик Томасо на Unsplash

Дълбоко учене

Дълбокото обучение е термин, използван за описание на невронни мрежи и свързани алгоритми, които консумират необработени данни. Данните се обработват през слоевете на модела за изчисляване на целевия изход.

Ненадзорното обучение е там, където техниките за дълбоко обучение се отличават. Правилно конфигурираният ANN е в състояние автоматично да идентифицира функции във входните данни, важни за постигане на желания изход. Традиционно тежестта за осмисляне на входните данни обикновено пада върху програмиста, изграждащ системата. Въпреки това, в настройките за задълбочено обучение самият модел може да идентифицира как да интерпретира данните, за да постигне смислени резултати. След като се обучи оптимизирана система, изискванията за изчислителна, памет и мощност на модела са значително намалени.

Казано по-просто, функционалните алгоритми за обучение позволяват на машината да се научи за конкретна задача, използвайки добре подходящи данни ... алгоритмите се научават как да се учат.

Дълбокото обучение е приложено към голямо разнообразие от задачи и се счита за една от иновативните техники на ИИ. Съществуват добре разработени алгоритми, подходящи за проблеми с обучението под надзора, без надзор и полу-надзор.

Shadow learning е термин, използван за описване на по-опростена форма на задълбочено обучение, при която селекцията на данните изисква предварителна обработка и повече задълбочени познания от програмиста. Получените модели могат да бъдат по-прозрачни и с по-висока производителност за сметка на увеличеното време на етапа на проектиране.

резюме

AI е мощно поле за обработка на данни и може да даде сложни резултати по-бързо от традиционното разработване на алгоритми от програмистите. ANNs и дълбоките техники за обучение могат да решат разнообразен набор от трудни проблеми. Недостатъкът е, че създадените оптимизирани модели са черна кутия и е невъзможно да се извадят от техните човешки създатели. Това може да доведе до етични проблеми, които прозрачността на данните е важна.