Python3

2 месяца назад

Векторный поиск ближайших соседей⁠⁠1

Был у меня недавно проект: в нем нужно было реализовать поиск похожих цветов в базе автоэмалей. База, к слову, не мелкая — около 60 тысяч записей. Пользователи — сотрудники, и им важно, чтобы всё работало шустро, без долгих загрузок и всяких «подождите, ищем».

Первая мысль, как у любого — нужен векторный поиск. Типа «найди мне ближайшие цвета по RGB или LAB пространству». Ну и естественно сразу в голове всплывает pgvector — оно на слуху, популярно, куча гайдов. Уже почти начал устанавливать, но в какой-то момент остановился и задал себе простой вопрос: «А оно мне точно надо?»

Контекст у меня был такой: база у меня на PostgreSQL, но всё приложение — внутреннее, без публичного API, и работает оно под капотом почти всё в памяти. Таблицы, с которыми постоянно работают, я подгружаю в оперативку через posix_ipc, и использую их в виде pandas DF. И вот тут я подумал: если данные уже в памяти, зачем мне вообще плодить сущности?

pgvector — это красиво, модно, но это лишняя прослойка. Это нужно ставить расширение, тащить данные обратно из базы, писать SQL-запросы, потом обрабатывать. Даже если обёртку сделать удобную — это будет ощутимо медленнее. И не просто медленнее — нужно будет юзеру показать лоадер, заставить его ждать. А я вот терпеть не могу, когда система тормозит и юзер ждёт, когда она «сообразит».

Я решил сделать проще. Раз таблица уже в DataFrame, почему бы не сделать обычный евклидов поиск по RGB координатам напрямую с помощью numpy? LAB можно тоже использовать — но чтобы не усложнять, если юзер вводит LAB, я просто прогоняю его через colorspacious в RGB. лоя металликов и перламутров берем только средний цвет - 45 градусов спектрофотометра.
Нам не нужно суперточности в духе "серый слегка серее", нам нужно — визуально похоже, и по ТЗ этого достаточно.

Сел, написал функцию. Получилось буквально на коленке, без всяких зависимостей кроме numpy и pandas. Работает за 0.01 секунды — и результат юзер видит моментально, как будто система заранее всё знала. Ни одного «ожидайте» на экране. Всё просто и по делу.

Вот сама функция:

def vector_search(df, r, g, b, count=30):
'''
descrip: Ищет count ближайших по цвету записей в df
param:
df — df с колонками r, g, b
r, g, b — координаты цвета
count — сколько ближайших цветов вернуть
return: df с колонками distance и similarity
'''
# Вычисляем евклидово расстояние между цветами
distances = np.sqrt((df['r'] - r) ** 2 + (df['g'] - g) ** 2 + (df['b'] - b) ** 2)
# Максимально возможное расстояние между цветами в RGB
max_distance = np.sqrt(255 ** 2 * 3)
# Вычисляем "похожесть" в процентах
similarity = 100 * (1 - distances / max_distance)
df['distance'] = distances
df['similarity'] = round(similarity, 2)# Для юзера процент совпадения
# Возвращаем ближайшие count записей по расстоянию
return df.nsmallest(count, 'distance')

Работает быстро, просто, понятно. Никаких зависимостей, никаких расширений к БД. Если честно, получаю моральное удовлетворение, когда делаю вот такие решения — без «enterprise боли», просто сработало и всё.

иногда лучше сесть, подумать и не городить велосипед, даже если он модный и с титановой рамой. Если можно обойтись наипростейшим решением — обходись.

Таким же способом можно организовать векторный полнотекстовый поиск. К примеру:

Берётся текст (название цвета, описание и т.п.) и прогоняется через векторизатор.
Самые простые:

• TfidfVectorizer из sklearn — быстрый, работает оффлайн.

• Или что-то вроде SentenceTransformer / fastText — они понимают смысл фразы.

Далее получаешь вектор запроса, сравниваешь его с векторами из базы через cosine similarity или ту же евклидову метрику. Это как расстояние между точками в многомерном пространстве.

Но такой задачи не было. Однако может кому-то пригодится.

Всех благ.

Векторный поиск ближайших соседей Программирование, Python, Программист, Текст, Длиннопост

Показать полностью 1

vitalyliakh

2 месяца назад

Защита зрения - Айтишник Лях Виталий⁠⁠

🙈Привет на связи Айтишник Лях Виталий. 👀 Устали от усталости глаз после работы за компьютером?

Знакомо ли вам:

• Размытое зрение после долгого работы за монитором

• Постоянное желание потереть глаза •

Головные боли к концу рабочего дня.

Я создал умное решение для защиты Вашего зрения! 👌

Представляем программу "Зашита зрения" - Ваш персональный помощник для здорового зрения 👁 Как это работает: ⏰ 50 минут работы → 5 минут отдыха ⏳ 10 минут работы → 8 секунд отдыха.

Почему это работает:

✅ Научно обоснованные интервалы

✅ Плавная профилактика усталости глаз

✅ Автоматическое напоминание о перерывах

✅ Простая настройка под ваши задачи

Ваши глаза скажут спасибо:

✨ Меньше усталости к концу дня

✨ Улучшение концентрации

✨ Профилактика синдрома сухого глаза

✨ Сохранение остроты зрения

Хотите попробовать?

Скачать можно тут, файл прикреплен к посту в архиве

ЯндексДиск (https://disk.yandex.ru/d/wQzcpgkVRsjssw)

VITALY LIAKH | ПРО IT (https://t.me/+UKooiFllylY1YmQy)

Поделитесь в комментариях: как часто вы делаете перерывы при работе за компьютером? 🤔

Показать полностью

Программист Python Продуктивность Видео Telegram (ссылка) Зрение

Аноним

2 месяца назад

Продолжение поста «Что я узнал когда стал простым программистом»⁠⁠1

Не собираюсь оспаривать большую часть того, что тут написано, но сам пост смешной.

Я три года писал скрипты, некоторые из которых умудрился кому-то продать. Я никогда не писал приложений и не был частью никаких проектов, или по крайней мере не был в курсе. Я не работал в фирмах. Я настолько недавно влился в мир программирования и настолько далек от проектов, что полагаю, будто 50% программ написаны ИИ. И теперь я знаю, что чаще всего программы написаны так-то, а программисты как люди чаще всего - такие-то то.

Программист Python IT Программирование Текст Ответ на пост

Аноним

2 месяца назад

Что я узнал когда стал простым программистом⁠⁠1

За моими плечами 3 года опыта, я написал более 150-200 скриптов, я продавал свои работы, у меня свои сервера, свои тг-боты и прочее. Я знаю о чем пишу. Однако, я никогда не работал программистом за ЗП - да и похер.

Я расскажу про опыт написаний единичных файлов скриптов на 100-200 строк python, а не о разработке каких-то приложений или целых проектов.

Иногда кажется, что программист делает что-то невероятное, какую-то магию, но на деле чаще всего это пара сотен строк непрофессионального кода, который на 50% написал бесплатный ИИ по самым тупым запросам. Но работает же. Иногда за один вечер можно лишить геммора несколько человек, написав просто скрипт мониторинга изменения какой-нибудь таблицы. Радость избавления от рутины - неописуема. А иногда хорошо написанные несколько скриптов могут работать годами с редкими минимальными правками.
Ошибки - это не просто нормально, это жизнь. Ты не напишешь ни один скрипт без ошибок, сколько бы у тебя не было опыта. Это просто нереально для обычного человека без супер-способностей. Есть клевый бонус - ты к ошибкам в жизни начинаешь относиться намного проще и вообще не переживаешь. Ошибся - да похер, бывает.
С каким бы блеском в глазах ты не учил программирование, как бы тебя это не засасывало - рано или поздно рутина написания скриптов тебя доконает и ты уже не будешь браться за программирование "по приколу". Только преследуя шкурный интерес. Увы, это быстро надоедает. Да, ты теперь можешь намного больше чем раньше, да, ты экономишь время и ресурсы за счет личного участия, но рано или поздно интерес сходит на нет. В среднем программисты увольняются с работ и уходят в другое русло на 4-6 год работы программистом. Увы, рутину сидеть и писать код не каждый может выдержать.
Оказалось, что каждый скрипт - это решённая математическая задача. Каждый. Скрипт. Нужно. Думать. Прям прикидывать сидеть. Прям думать. Это не весёлое клацание по клавиатуре. Иногда пару строк пишешь 15-20 минут. Иногда целые блоки переписываешь, потому что понимаешь, что можно было проще и легче. И это бесит.
Самое невероятное, что я понял - оказывается в работе программистом ничего сложного нет. Есть сложные задачи - да, но любая сложная задача распаковывается на кучу мелких и несложных. Программист - это как любой знаток иностранного языка, только программист общается с железом, опять же через английский язык. Ты просто пишешь "возьми эту таблицу, отфильтруй, замени эти символы, а потом отправь её на сервер". По сути ты берёшь английские буквы и просто используешь конкретные правила написания команд. Всё.
В большинстве своём программисты асоциальны (личное наблюдение). Сколько бы я программистов не знал - каждый из них был либо отбитым наглухо, либо жутким тихоней, либо невероятно неприятным типом.
Сам по себе программист - это просто копирайтер математик. Он решает задачи, просто использует нужные правила написания английских слов. Ему не интересно быть богатым и написать что-то невероятно полезное и интересное, а даже если и так, то на выходе получается какой-то шлак. Я знаю несколько примеров, когда вроде неплохие проггеры делали абсолютно несъедобный мусор, который решал хз какие задачи, как правило ненужные ну может десятку человек от силы.
Однако, когда ты сначала стал маркетологом, а потом программистом - вот тут то глазки и открываются. Ты начинаешь понимать намноооооооого больше среднестатистического человека. Ты не просто понимаешь ЧТО можно сделать, ты уже понимаешь какими малыми ресурсами тебе это обойдётся и как ты это потом продавать будешь.
И да, работа обычного программиста - не стоит дорого. Конские ЗП получает дай бог 10% от всего количества программистов вообще. И как правило такие ЗП своим сотрудникам могут платить только ИТ гиганты.

Скроюсь, пожалуй. Простите.
Если зайдёт - напишу ещё.

Показать полностью

Программист Python IT Программирование Текст

PyMimo

2 месяца назад

Какой лучший ЯП для создания веб-приложений?⁠⁠

Я создавал разные приложения и сайты.
Больше всего у меня проектов на Flask (python).

Но я хотел бы узнать, какие еще есть библиотеки для этого?
Знаете ли вы, какая библиотека или ЯП для этого подойдёт лучше всего?
Подскажите, пожалуйста, буду очень благодарен

[моё] Python Flask Вопрос Веб-разработка Web Текст

Nichteye121

2 месяца назад

Программирование на python

Видос про телеграм бота с джангой⁠⁠

супер простой бот, который инициализирует бота в бд

[моё] YouTube Программирование Python Джанго Telegram Bots Видео

Jelizaveta

2 месяца назад

Программирование на python

3 библиотеки для преобразования цветных PDF в черно-белые с помощью Python: Руководство по сравнению⁠⁠

Оглавление:

Обзор
Зачем преобразовывать цветные PDF-файлы в черно-белые?
Библиотеки для преобразования PDF
- Spire.PDF for Python
- PyMuPDF
- pdf2image
Сравнение библиотек
Заключение

3 библиотеки для преобразования цветных PDF в черно-белые с помощью Python: Руководство по сравнению Python, Pdf, Развитие, Длиннопост

Обзор

В современную цифровую эпоху файлы PDF являются стандартом для обмена документами. Преобразование цветного PDF в черно-белый может быть полезно для печати, уменьшения размера файла или улучшения читабельности.

Python предлагает несколько библиотек для работы с PDF, в том числе для преобразования цветных PDF в черно-белые. В этой статье мы рассмотрим три популярные библиотеки для этой задачи, выделим их плюсы и минусы, чтобы помочь вам выбрать лучший вариант для ваших нужд.

Зачем преобразовывать цветные PDF-файлы в черно-белые?

Прежде чем перейти к рассмотрению библиотек, необходимо понять, почему вам может понадобиться преобразовать цветной PDF в черно-белый. Вот несколько причин:

Экономичная печать: Черно-белая печать позволяет значительно сократить расходы на печать, особенно в условиях, когда печатаются большие объемы документов.
Улучшенная читаемость: Для некоторых документов черно-белая печать может повысить удобочитаемость за счет минимизации отвлекающих факторов, вызванных цветами.
Соответствие требованиям и архивирование: Некоторые организации требуют архивировать документы в черно-белом формате для соблюдения правовых норм.

Библиотеки для преобразования PDF

Теперь давайте обсудим три популярные библиотеки Python для преобразования цветных PDF-файлов в черно-белые: Spire.PDF for Python, PyMuPDF и pdf2image. У каждой из этих библиотек есть свои сильные и слабые стороны, которые мы подробно рассмотрим.

1. Spire.PDF for Python (коммерческая библиотека с доступной бесплатной версией)

Обзор

Spire.PDF for Python - это мощная библиотека, предназначенная для работы с PDF. Она позволяет легко конвертировать PDF в различные форматы, включая преобразование цветных PDF в черно-белые.

Установите Spire.PDF for Python:

pip install spire.pdf

Пример кода

Вот базовый пример того, как использовать Spire.PDF для преобразования цветного PDF в черно-белый:

from spire.pdf.common import *
from spire.pdf import *
input_pdf = "C:/Users/Administrator/Desktop/input.pdf"
output_pdf = "output/black_and_white.pdf"
# Загружаем PDF-документ, инициализируя класс PdfGrayConverter
converter = PdfGrayConverter(input_pdf)
# Конвертируем документ в градации серого
converter.ToGrayPdf(output_pdf)

Плюсы:

Сохраняет текст и векторную графику: Преобразует PDF-файлы в черно-белые без растеризации, сохраняя возможность выделения и поиска текста.
Высокоуровневый API: Простой в использовании API, разработанный для задач по работе с PDF.
Расширенные возможности: Поддержка расширенных функций PDF, таких как аннотации, формы, шифрование и многое другое.
Коммерческая поддержка: Профессиональная поддержка, регулярные обновления и документация.
Кроссплатформенность: Работает в Windows, macOS и Linux.

Минусы:

Стоимость: Это коммерческая библиотека, поэтому для использования в производстве необходимо приобрести лицензию.
Ограниченный бесплатный уровень: Бесплатная версия имеет ограничения по количеству обрабатываемых страниц.
Зависимость: Добавляет зависимость от сторонней библиотеки, что может быть не идеальным для проектов с открытым исходным кодом или легких проектов.

2. PyMuPDF (с открытым исходным кодом)

Обзор

PyMuPDF, также известная как Fitz, - это легкая и быстрая библиотека PDF для Python. Она поддерживает различные форматы документов и предоставляет функции для манипулирования и рендеринга PDF-файлов.

Установите PyMuPDF:

pip install pymupdf

Пример кода

Вот как можно преобразовать цветной PDF в черно-белый с помощью PyMuPDF:

import fitz # PyMuPDF
def convert_to_black_and_white(input_pdf, output_pdf, dpi=150):
# Открываем входной PDF
pdf_document = fitz.open(input_pdf)

# Создаем новый PDF для выхода
new_pdf = fitz.open()

# Определяем матрицу для контроля разрешения (DPI)
# Стандартный DPI для get_pixmap() равен 72, поэтому мы масштабируем соответственно
zoom = dpi / 72 # Коэффициент масштабирования для желаемого DPI
matrix = fitz.Matrix(zoom, zoom)

# Проходим по каждой странице
for page_num in range(len(pdf_document)):
page = pdf_document.load_page(page_num)

# Получаем пиксмап (изображение) страницы с заданным разрешением
pix = page.get_pixmap(matrix=matrix, colorspace=fitz.csGRAY, alpha=False)

# Создаем новую страницу в новом PDF с теми же размерами
new_page = new_pdf.new_page(width=pix.width, height=pix.height)

# Вставляем изображение в градациях серого на новую страницу
new_page.insert_image(new_page.rect, pixmap=pix)

# Сохраняем новый PDF
new_pdf.save(output_pdf)
new_pdf.close()
pdf_document.close()
# Пример использования
input_pdf = "C:/Users/Administrator/Desktop/input.pdf"
output_pdf = "output/black_and_white.pdf"
convert_to_black_and_white(input_pdf, output_pdf, dpi=300) # Устанавливаем DPI на 300 для более высокого качества

Плюсы:

Открытый исходный код: Свобода использования и модификации.
Высокая производительность: Чрезвычайно быстро и эффективно выполняет задачи по работе с PDF.
Сохраняет текст и векторную графику: Возможность работать с содержимым PDF напрямую без растеризации (при правильном использовании).
Гибкость: Поддерживает широкий спектр операций с PDF, включая рендеринг, извлечение текста и аннотирование.
Легкий: Минимум зависимостей, легко интегрируется в проекты.

Минусы:

Сложность: API может быть сложным для новичков, особенно для выполнения сложных задач.
Требуется растеризация для преобразования на основе изображений: Если вам нужно преобразовать страницы в черно-белый формат путем растеризации, это потребует дополнительных шагов (например, преобразования страниц в изображения и обратно).
Ограниченная документация: Несмотря на мощную библиотеку, документация может быть скудной для некоторых случаев использования.

3. pdf2image (с открытым исходным кодом)

Обзор

Библиотека pdf2image предназначена в первую очередь для преобразования PDF-файлов в формат изображений. Однако с помощью библиотеки Pillow вы можете преобразовать эти изображения в полутоновые и сохранить их обратно в виде PDP.

Установите pdf2image и Pillow:

pip install pdf2image pillow

Кроме того, pdf2image использует библиотеку Poppler для преобразования PDF-файлов в изображения. Poppler является отдельной системной зависимостью и должен быть установлен на вашей машине.

Пример кода

Вот пример использования pdf2image для преобразования цветного PDF в черно-белый:

from pdf2image import convert_from_path
from PIL import Image

def convert_pdf_to_bw(input_pdf, output_pdf, dpi=200, poppler_path=None):
# Шаг 1: Конвертируем страницы PDF в изображения
images = convert_from_path(input_pdf, dpi=dpi, poppler_path=poppler_path)

# Шаг 2: Конвертируем изображения в градации серого
bw_images = []
for image in images:
bw_image = image.convert("L") # Конвертируем в градации серого
bw_images.append(bw_image)

# Шаг 3: Сохраняем изображения в градациях серого как новый PDF
bw_images[0].save(output_pdf, save_all=True, append_images=bw_images[1:])

# Пример использования
input_pdf = "C:/Users/Administrator/Desktop/input.pdf"
output_pdf = "output/black_and_white.pdf"
poppler_path = "C:/poppler-24.08.0/Library/bin" # Требуется только если Poppler не в PATH
convert_pdf_to_bw(input_pdf, output_pdf, dpi=300, poppler_path=poppler_path)

Плюсы:

Простота и удобство использования: Ориентирован на преобразование PDF-файлов в изображения, что делает его удобным для работы с изображениями.
Открытый исходный код: Свободно используется и модифицируется.
Интеграция с Pillow: Работает с библиотекой Pillow для обработки изображений (например, преобразования в оттенки серого).
Кроссплатформенность: Работает в Windows, macOS и Linux.

Минусы:

Растеризация: Преобразует PDF-страницы в изображения, что означает потерю текста и векторной графики (текст больше не может быть выделен или доступен для поиска).
Размер файла: Выходные PDF-файлы могут стать большими, особенно при высоких значениях DPI.
Зависимость от Poppler: Требуется установка библиотеки poppler, что может стать препятствием для некоторых пользователей.
Ограниченность рабочими процессами, основанными на изображениях: Не подходит для задач, требующих работы с текстом или вектором.

Сравнение библиотек

Заключение

Выбор подходящей библиотеки для преобразования цветных PDF-файлов в черно-белые в Python зависит от ваших конкретных требований, включая сложность PDF-файлов, потребности в производительности и дополнительные возможности.

Взвесив все плюсы и минусы каждой из рассмотренных библиотек, вы сможете принять взвешенное решение, которое подойдет именно вашему проекту. Независимо от того, являетесь ли вы разработчиком, аналитиком данных или бизнес-профессионалом, эти инструменты помогут вам эффективно управлять PDF-документами.

Показать полностью 2

Python Pdf Развитие Длиннопост

leshapikabu57

2 месяца назад

Бот напоминалка в Телеграм. Notico поможет эффективно управлять напоминаниями в групповых чатах⁠⁠

Про идею создания бота и описание базовых функций можно почитать в предыдущем посте - тут

Notico стал умнее.

Теперь добавлять напоминания стало удобнее, бот может сразу распознать дату и периодичность напоминания.

Бот напоминалка в Телеграм. Notico поможет эффективно управлять напоминаниями в групповых чатах Telegram, Чат-бот, Python, Программирование, IT, Напоминание, Гайд, Telegram бот, Reminder, Продуктивность, Лайфхак, Длиннопост

Наглядный пример работы.

Кстати, кто еще не пользуется ботом, вот ссылка — t.me/NoticoBot
🤫Он полностью бесплатен и доступен для всех желающих.

Notico получил полную поддержку работы в группах.

По просьбам пользователей была разработана поддержка бота в группах.
✅Коротко о работе Notico в группах:
— для каждой группы отдельная настройка языка и таймзоны
— функционал напоминаний не изменился
— добавлять новые напоминания можно как в боте так и в чате группы
— смотреть список и редактировать напоминания группы можно только в самом боте
— взаимодействовать с ботом в группе могут только администраторы, для всех остальных установлен игнор

Краткий мануал по настройке бота в группе.

Чтобы начать, необходимо добавить бота в группу. Затем в самом боте через меню перейдите в раздел «Напоминания в группах».

Выберите свою группу из списка и настройте её.

Напоминания можно добавлять прямо в боте. Выберите свою группу, перейдите в раздел «Напоминания» и добавьте новое напоминание. Процесс аналогичен добавлению напоминаний в обычном режиме, но уже для группы.

Добавлять напоминания можно в чате группы с помощью команды /rem + текст напоминания.

Пример добавления напоминания в группе, просто и быстро.

Бот позволяет эффективно управлять напоминаниями в групповых чатах, делая коммуникацию и планирование более организованными.

Плюсы использования Notico:
-- экономия времени
-- планировка задач
-- отсутствие риска забыть о чем-либо — все участники группы всегда в курсе текущих дел и актуальной информации.

Будущее Notico!

Бот будет продолжать развиваться и получать новые обновления. Я сам им пользуюсь и мне очень нравится делать его еще проще и удобнее.
Если у вас есть предложения или пожелания, не стесняйтесь оставлять их в комментариях.

Обратная связь — это ключ к тому, чтобы сделать Notico еще более функциональным и удобным для всех нас!

Также присоединяйтесь к нашему сообществу и давайте сделаем свою жизнь продуктивнее!
Тг канал — t.me/notico_news

Показать полностью 2

[моё] Telegram Чат-бот Python Программирование IT Напоминание Гайд Telegram бот Reminder Продуктивность Лайфхак Длиннопост

Посты не найдены

15 16 17 18 19 20 21 22 23 24 25 30 40 50 60 110