PCA анализ топа русскоязычного ЖЖ

Провел небольшой анализ топа пользователей русскоязычного ЖЖ. Целью было выявить некоторые группы предпочитающих друг-друга для дружбы пользователей на основе анализа данных о взаимодружбе первой тысячи пользователей топа. К сожалению, очень явно выраженных групп не получилось - все пользователи в топе в целом склонны дружить примерно с одними и теми же людьми. Тем не менее кое какие тенденции прослеживаются.

Read More

Очищаем скан листа от линеек с помощью фурье-преобразования.

На рисунке ниже пример скана тетрадного листа в линейку с цифрами, которые мы хотим распознать. Линейки нам довольно сильно мешают, особенно когда перечеркивают цифры. Хотелось бы их убрать, а цифры оставить. К счастью, это возможно.

Read More

Векторизируем график функции(python, skimage)

Пусть у нас есть картинка, содержащая график функции, где прямоугольниками обозначены её значения в отдельных точках, которые соединены прямыми линиями. Задача - определить координаты вершин и связи между ними и нарисовать векторизированное изображение того же самого.

Read More