Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam

Пикабу Игры +1000 бесплатных онлайн игр

Сможешь найти все слова, спрятанные в пузырях? Скорее заходи в игру и проверь!

Слова в пузырях

Казуальные, Головоломки, Словесная

Играть
Грибные блоки - красочная головоломка, в которой вам предстоит передвигать блоки и заполнять ряды, чтобы собирать грибочки в корзину! Попробуйте продержаться как можно дольше!

Грибные блоки

Головоломки, Расслабляющая, Пазлы

Играть
Веселая аркада с Печенькой для новогоднего настроения. Объезжайте препятствия, а подарки, варежки, конфеты и прочие приятности не объезжайте: они помогут набрать очки и установить новый рекорд.

Сноуборд

Спорт, Аркады, На ловкость

Играть
Погрузитесь в логическую головоломку: откручивайте болты из планок на самых сложных уровнях! Вы не только расслабитесь в конце сложного дня, но еще и натренируете свой мозг, решая увлекательные задачки. Справитесь с ролью опытного мастера? Попробуйте свои силы в режиме онлайн бесплатно и без регистрации!

Головоломка. Болты и Гайки

Казуальные, Гиперказуальные, Головоломки

Играть
Постройте дом своей мечты прямо сейчас! Соединяйте три предмета в один ряд, зарабатывайте звезды и покупайте красивые детали интерьера. Звучит заманчиво? Увлекательная головоломка в жанре «три в ряд» заставит размяться ваш мозг. Присоединяйтесь к онлайн-игре бесплатно прямо сейчас!

Строить дом - три в ряд

Три в ряд, Казуальные, Детские

Играть

Топ прошлой недели

  • CharlotteLink CharlotteLink 1 пост
  • Syslikagronom Syslikagronom 7 постов
  • BydniKydrashki BydniKydrashki 7 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Новости Пикабу Помощь Кодекс Пикабу Реклама О компании
Команда Пикабу Награды Контакты О проекте Зал славы
Промокоды Скидки Работа Курсы Блоги
Купоны Biggeek Купоны AliExpress Купоны М.Видео Купоны YandexTravel Купоны Lamoda
Мобильное приложение

Julia

С этим тегом используют

Аниме Все
16 постов сначала свежее
215
Turklton
Turklton
5 лет назад
Клубничный арт

Lingerie Julia⁠⁠

Lingerie Julia Jago, Julia, Lwhag, Нижнее белье, Арт, Рисованная эротика, Эротика
Показать полностью 1
18+ Jago Julia Lwhag Нижнее белье Арт Рисованная эротика Эротика
0
4
DELETED
5 лет назад
ИТ-проекты пикабушников

Нейронная сеть для распознавания имен на Julia (Flux.jl)⁠⁠

Доброго времени суток,


хотел бы поделиться своей небольшой работой в области машинного обучения. Данный материал не стоит рассматривать как гайд или урок, так как я близко не являюсь датасаентистом, просто подвернулся интересная задача, и я решил использовать нейронные сети для ее решения.


Суть задачи: есть у нас около 112 тысяч никнеймов. Кто-то пишет свое реальное имя правильно, кто-то пишет, но не правильно, кто-то решил написать какое-либо слово, кто-то - абсурдный никнейм по типу аувау324. И вот нам нужно узнать, сколько в данном списке имен Влад, сколько - Саша, и сколько "мусорных" имен.


Решить данную задачу можно было и без использования ML, но:

а) это было бы долго и много ручной работы

б) хотелось поиграться с нейронками


Решая данную задачу, я во многом полагался на данную интересную статью на Хабре.

Во время решения донного задания я допустил несколько критических ошибок, которые повлияли на конечный результат (ошибки рассмотрю по ходу объяснения алгоритма решения).


Алгоритм решения:

1) Подготовка данных

Первым делом нужно было подготовить данные к манипуляциям. Чем меньше лишних данных и чем меньше форм этих данных - тем лучше справятся алгоритмы машинного обучения.


Важно понимать, что свести все данные к одной форме и убрать n-нное количество информации - не одно и тоже. Можно сравнить данный процесс со сжатием без потерь - информация не удаляется, изменяется лишь ее форма.


Подготовил данные я следующим образом:

1) Преобразовал все слова в lowercase.

2) Нормализировал UTF символы (например, перевел ó в о).

3) Удалил смайлики и прочий мусор из имен.

4) Удалил имена, которые имели 2 символа или меньше.


Важный момент(!) - так как в базе мы имели имена на английском (например Julia), транслитом (например Yulia) и кириллицей (Юлия\Юлія), я не додумался перевести все имена, допустим, на латинские буквы, что повлияло на сложность вычислений и на точность нейронной сети. Это важный момент - все данные должны быть в одной форме.


2) Составления словаря

Если вы знакомы с нейронными сетями, то знаете, что у нейронной сети есть входной слой, размер которого определен на этапе "компиляции" тела нейронной сети и не может быть изменен в ходе выполнения алгоритма. Плюс, нам нужно представить слова как набор чисел, с которыми сможет удобно работать наша нейронка.


Для решения данного пункта я воспользовался материалом с Хабровской статьи, и создал словарь для моего набора слов.

Создавал я словарь следующим образом:

1) Каждое слово делил на би-граммы (если в слове было нечетное количество букв - то на би-граммы и уни-граммы).

2) Далее, если данной би-граммы\уни-граммы еще нет в словаре - записывал ее в словарь. На выходе у меня получился словарь из 2371 би-грамм\уни-грамм без повторений.


Почему я использовал би-граммы, а не уни-граммы? Мой алгоритм не предусматривал определения, например, количества данной буквы в слове, и поэтому нейронная сеть не смогла бы отличить слово "Ана" от "Анна", и вот почему...


3) Векторизация словаря

Теперь нам нужно превратить наш словарь и слова, которые мы будем запихивать в нейронку, в цифры.


Для начала векторизируем словарь:

1) Так как наш словарь имеет 2871 элемент, закодируем каждое "слово" из словаря в 2371-элементный вектор. Для примера, имеем словарь ["a", "b", "c"] - тогда буква "а" будет иметь вектор [1, 0, 0] относительно словаря, "b" - [0, 1, 0], "c" - [0, 0, 1]. И теперь, если мы захотим векторизировать слово "abbca" относительно такого словаря, то у нас получится вектор [1, 1, 1]. И теперь понимаем, почему данный алгоритм не смог бы различаться некоторые слова, если бы мы использовали уни-граммы - для него что слово "aaabbbbccc", что "abc", имеют одинаковый вектор [1, 1, 1].


Таким Макаром мы также установили количество входных нейронов для нашей сети - 2371, так как каждое наше слово теперь будет кодироваться относительно словаря в 2371-размерный вектор и на каждый нейрон будет подаваться 1 или 0.


4) Создание нейронной сети

Самый спорный момент, так как я почти не разбираюсь в проектировании нейронных сетей и ML в целом, так что я эмпирическим путем узнал, что моя видеокарта способна с адекватной скоростью тренировать нейронку с одним входным слоем, одним скрытым на 1840 нейронов, один скрытый на 700 нейронов, ну и один выходной слой (кстати, размер выходного слоя у нас зависит от количества классов, которые вы хотите иметь. Я хотел, что бы нейронка смогла различить 105 разных имен, поэтом размер выходного слоя у меня соответственный). Такая нейронная сеть давала мне около 75% точности после 100 эпох обучения.


5) Подготовка данных

Вручную мною было классифицировано 2000 имен. По ходу ручной классификации было найдено 105 уникальных имени (класс №1 означал "мусорное имя"). На этих именах я тренировал и тестировал нейронную сеть.


Вот, в принципе, и вся история. Надеюсь, данная информация поможет кому-то не допустить ошибок, которые допустил я, или в качестве примера для построения более сложного алгоритма. Весь код проекта можно найти на тут.


Удачи, никогда не забывайте, что программирование - это не знания языка программирования, а в первую очередь умение правильно управлять данными. А еще проектирование не помешает :)

Показать полностью
[моё] Программирование Знания Нейронные сети Распознавание Julia Flux Data Science Длиннопост Текст
10
485
Turklton
Turklton
5 лет назад
Комиксы

Комикс 414⁠⁠

Комикс 414 Jago, Jagodibuja, Carmen, Sonia, Комиксы, Длиннопост, Julia
Комикс 414 Jago, Jagodibuja, Carmen, Sonia, Комиксы, Длиннопост, Julia
Комикс 414 Jago, Jagodibuja, Carmen, Sonia, Комиксы, Длиннопост, Julia
Комикс 414 Jago, Jagodibuja, Carmen, Sonia, Комиксы, Длиннопост, Julia
Показать полностью 4
Jago Jagodibuja Carmen Sonia Комиксы Длиннопост Julia
32
122
CheshirYurka
CheshirYurka
6 лет назад

Прекраснейшая Julia с сетом "It's Break Time!"⁠⁠

Вгляд за душу берёт.

Прекраснейшая Julia с сетом "It's Break Time!" Suicide Girls, Julia, Глаза, Грудь, Длиннопост
Прекраснейшая Julia с сетом "It's Break Time!" Suicide Girls, Julia, Глаза, Грудь, Длиннопост
Прекраснейшая Julia с сетом "It's Break Time!" Suicide Girls, Julia, Глаза, Грудь, Длиннопост
Прекраснейшая Julia с сетом "It's Break Time!" Suicide Girls, Julia, Глаза, Грудь, Длиннопост
Прекраснейшая Julia с сетом "It's Break Time!" Suicide Girls, Julia, Глаза, Грудь, Длиннопост
Прекраснейшая Julia с сетом "It's Break Time!" Suicide Girls, Julia, Глаза, Грудь, Длиннопост
Прекраснейшая Julia с сетом "It's Break Time!" Suicide Girls, Julia, Глаза, Грудь, Длиннопост
Прекраснейшая Julia с сетом "It's Break Time!" Suicide Girls, Julia, Глаза, Грудь, Длиннопост
Прекраснейшая Julia с сетом "It's Break Time!" Suicide Girls, Julia, Глаза, Грудь, Длиннопост
Показать полностью 9
18+ Suicide Girls Julia Глаза Грудь Длиннопост
13
181
Bulkodav
Bulkodav
6 лет назад

Cowboy Bebop⁠⁠

Cowboy Bebop Anime Art, Аниме, Cowboy Bebop, Spike Spiegel, Julia, Gennah1984

https://www.artstation.com/gennah1984

Показать полностью 1
Anime Art Аниме Cowboy Bebop Spike Spiegel Julia Gennah1984
3
162
Turklton
Turklton
7 лет назад

Julia⁠⁠

Julia Jago, Lwhag, Julia, Мама, Арт
Показать полностью 1
18+ Jago Lwhag Julia Мама Арт
13
32
Bulkodav
Bulkodav
7 лет назад

Дождь⁠⁠

Дождь Anime Art, Аниме, Idolmaster, Chihaya Kisaragi, Julia, Bukimi isan
Показать полностью 1
Anime Art Аниме Idolmaster Chihaya Kisaragi Julia Bukimi isan
2
77
MrWhite1
MrWhite1
9 лет назад

Anime Art №654⁠⁠

Anime Art №654 Аниме, Anime Art, Idolmaster, Julia

くらのせ

Показать полностью 1
Аниме Anime Art Idolmaster Julia
6
Посты не найдены
О Нас
О Пикабу
Контакты
Реклама
Сообщить об ошибке
Сообщить о нарушении законодательства
Отзывы и предложения
Новости Пикабу
RSS
Информация
Помощь
Кодекс Пикабу
Награды
Команда Пикабу
Бан-лист
Конфиденциальность
Правила соцсети
О рекомендациях
Наши проекты
Блоги
Работа
Промокоды
Игры
Скидки
Курсы
Зал славы
Mobile
Мобильное приложение
Партнёры
Промокоды Biggeek
Промокоды Маркет Деливери
Промокоды Яндекс Путешествия
Промокоды М.Видео
Промокоды в Ленте Онлайн
Промокоды Тефаль
Промокоды Сбермаркет
Промокоды Спортмастер
Постила
Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии