ЕГЭ по информатике - на 101 балл!

Задача типа #27: Анализ данных

27

Анализ данных

NA Средняя сложность 10.06.2025 id: 127009

Фрагмент звёздного неба спроецирован на плоскость с декартовой системой координат. Учёный решил провести кластеризацию полученных точек, являющихся изображениями звёзд, то есть разбить их множество на N непересекающихся непустых подмножеств (кластеров), таких, что точки каждого подмножества лежат внутри прямоугольника со сторонами длиной H и W, причём эти прямоугольники между собой не пересекаются. Стороны прямоугольников не обязательно параллельны координатным осям. Гарантируется, что такое разбиение существует и единственно для заданных размеров прямоугольников.
Будем называть центром кластера точку этого кластера, сумма расстояний от которой до всех остальных его точек минимальна. Для каждого кластера гарантируется единственность его центра. Расстояние между двумя точками на плоскости A(x1, y1) и B(x2, y2) вычисляется по формуле Евклидова расстояния.

В файле A хранятся данные о звёздах двух кластеров, где H=6, W=4,5 для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x, затем координата y. Значения даны в условных единицах. Известно, что количество звёзд не превышает 1000.
В файле Б хранятся данные о звёздах трёх кластеров, где H=5, W=6 для каждого кластера. Известно, что количество звёзд не превышает 10 000. Известно, что в файле Б имеются координаты ровно трёх «лишних» точек, являющихся аномалиями, возникшими в результате помех при передаче данных. Эти три точки не относятся ни к одному из кластеров, их учитывать не нужно.

Для файла А определите координаты центра каждого кластера, затем вычислите два числа: Px – максимальную из абсцисс центров кластеров, и Py – максимальную из ординат центров кластеров.

Для файла Б определите координаты центра каждого кластера, затем найдите два числа: Qx - разность абсцисс центров кластеров с минимальным и максимальным количеством точек, и Qy - разность ординат центров кластеров с минимальным и максимальным количеством точек. Гарантируется, что во всех кластерах количество точек различно.

В ответе запишите четыре числа: в первой строке сначала целую часть абсолютного значения произведения Px × 10000, затем целую часть произведения Py × 10000 для файла А, во второй строке – сначала целую часть абсолютного значения произведения Qx × 10 000, затем целую часть абсолютного значения произведения, затем целую часть абсолютного значения произведения Qy × 10 000.

📁 Файл для задачи 📁 Файл для задачи

Ответ:
6216 24182
150891 63754
Алгоритм решения: Для распределения по кластерам можно использовать функцию построения точечного графика в табличном редакторе. Вычисления произведите в Python c использованием библиотеки math.
Возможно другое решение.

Посмотреть решение задачи (код на Python) в Telegram боте по ID задачи 127009

Другие задачи типа #27: Анализ данных