Тест презентация. Цель этой презентации. Ответить на вопрос Может ли в будущем ии заменить программиста
Скачать 12.94 Kb.
|
2 Слайд Цель этой презентации. Ответить на вопрос Может ли в будущем ИИ заменить программиста. 3 Слайд Задачи работы Исследовать принципы работы автодополнения кода Разобрать математические модели работы Изучить проблемы в успешном развитии ИИ Изучить переспективы и актуальность этого направления 4 Слайд Рассмотрим генерацию не больших программ,а маленьких кусочков кода, которые упрощают жизнь программистам. Это называется автодополнение. Данные здесь сортируются машинным обучением, это удобнее, быстрее и более надежно. 5 Слайд Для успешной работы автодополнения есть 2 задачи. Откуда-то взять варинаты и правильно их отсортировать 6 Слайд Рассмотрим первую задачу Откуда мы берем варианты для автодополнения 7 Слайд Варианты в основном берутся из статического анализа блока кода (Рассказать про иерархию кода/методов/классов и тд)' Если пройти по всему этому графу то можно получить что у нас доступно и получить список подсказок. 8 Слайд Переходим к следующему шагу. Мы получили варианты, как их отсортировать. 9 Слайд Сортируем подсказки дискриминативной моделью. 10 Слайд Дискримативная модель. Обьясним на примере задачи которую вы видите на экране. Какую цифру написал человек. У нас есть что-то рукописное. Есть Label – это те цифры которые хотел написать человек. ДМ когда мы подаем на вход новую цифру, модель определяет какая цифра получилась в итоге. Ошибки стараемся уменьшать. В случае если модель ответила правильно поощряем ее 11 Слайд Если модель дала неверный ответ наказываем, тем самым уменьшая ошибку. 12 Слайд Для получения Label дискриминативной модели, нужно откуда-то брать даанные. Используем гитхаб. 13 Слайд (на экране пример случайного кода) Можно брать случайные репозитории и случайные части кода. 14 Слайд Выбираем случайный кусок кода. 15 Слайд Удаляем всё что идет после. 16 слайд вызываем автодополнение и модель должна правильно предсказать что у нас должно получиться. 17 Слайд. Для обучения модель нам откуда-то нужно брать код. Код в гитхаб. Почему он нам не подходит. Если код лежит в гитхабе всё компилируется ... (дальше со слайда) 18 Слайд Соответственно нужно собирать данные реальных пользователей. Почему нельзя собирать данные настоящих пользователей – код это интелектуальная собственность и поэтому нельзя просто так собирать и отправлять его 19 Слайд. Тут у нас получается первая проблема развития ИИ. Нет данных для обучения. 20 Слайд Но некоторые данные пользователей всё-таки собираются. (Слайд) 21 Слайд рассмотрим генеративные модели. Генеративные модели для них не нужны Label которые являются правильным ответом. На вход в модель подается затравка, а сама модель уже дополняет цифру до похожего числа. В такой модели нет истинности. 22 Слайд текст со слайда 23 Для автодополнения кода существуют Tabnine, Kite, которые написаны на основе генеративной модели GPT-2 24 Видео включаем комментируем скорость работы 25 Когда пора остановиться генерировать код И что делать с дублями ведь для генеративной модели они по факту разные, а для программиста они одинаковые. 26 На смену GPT-2 Пришла новая модель GPT-3 в которой уже 175 млрд параметров на ней написаны Copilot и ChatGpt. 27 Сколько стоить обучить такую модель. на самой современной видеокарте которая стоит около 700 т. рублей. 28 Делаем вывод читаем и комментируем слайд. (Статистика настоящая JetBrains). Делаем вывод что человек больше думает над решением задачи, чем над написанием кода. 29 Слайд Вывод работы. цитата Ричарда Хэмминг Смысл в том что человек должен использовать машину(компьютер), совместно в качестве своего инструмента для ускорения. |