Главная страница

Содержимое файла data csv


Скачать 53.74 Kb.
НазваниеСодержимое файла data csv
Дата28.10.2022
Размер53.74 Kb.
Формат файлаrtf
Имя файла111.rtf
ТипДокументы
#759453

С использованием библиотеки Pandas проводится предварительный анализ данных, содержащихся в файле data.csv. Посредством анализа данных необходимо определить среднее значение параметра A5 для элементов списка, полученных путем отбора данных по условиям А2 > 0 и A3 < 1. Ответ требуется округлить с помощью функции round() до 2 знаков и записать через символ ".".

Содержимое файла data.csv:

,A1,A2,A3,A4,A5,A6,C

0,-1.844,-5.724,5.399,-0.726,1.338,3.529,1.0

1,-1.171,-1.522,1.312,-2.735,4.157,1.589,1.0

2,5.073,3.31,2.263,0.627,-6.838,8.14,2.0

3,7.337,8.954,10.078,-0.597,-5.694,-8.924,0.0

4,7.756,9.522,7.073,1.719,-1.941,-7.76,0.0

5,-6.067,-3.552,-2.172,12.055,-1.027,9.196,4.0

6,-6.203,-3.726,-11.737,11.931,-6.474,-5.561,3.0

7,0.427,6.556,5.77,-1.031,-4.622,10.476,2.0

8,-1.855,-0.338,-7.46,10.973,-7.351,-2.017,3.0

9,4.177,8.404,8.455,2.949,-5.022,-11.118,0.0

10,-12.519,-6.159,-1.859,7.161,-3.041,12.971,4.0

11,-4.346,-5.967,-10.505,8.612,-7.295,-8.251,3.0

12,5.387,9.22,2.005,-1.851,-2.511,10.092,2.0

13,-2.612,-0.092,1.167,-2.336,1.411,0.869,1.0

14,4.855,0.748,-0.027,-0.63,-4.996,6.364,2.0

15,-11.13,-7.85,-2.068,7.775,-2.005,9.357,4.0

16,4.062,6.732,1.287,-2.924,-5.362,6.697,2.0

17,-7.395,-7.371,-1.376,9.762,-4.519,10.444,4.0

18,-4.711,-8.054,-3.441,10.949,-7.459,11.293,4.0

19,-3.446,-10.493,-9.346,10.603,-9.213,-5.445,3.0

20,1.199,11.65,3.644,-2.941,-5.09,-12.474,0.0

21,-3.125,-5.717,-9.179,7.047,-8.595,-5.086,3.0

22,-0.721,-1.203,1.881,-2.834,1.11,-0.975,1.0

23,-3.961,-5.308,-7.962,10.168,-4.591,-1.703,3.0

24,7.901,9.31,-1.287,-0.668,-0.954,9.032,2.0

25,10.354,8.928,7.446,0.981,-5.471,-10.855,0.0

26,10.577,10.765,5.761,-2.669,-4.684,-7.322,0.0

27,-0.398,-4.616,-3.928,-1.304,6.197,3.168,1.0

28,-6.942,-2.812,-4.877,7.942,-0.428,8.04,4.0

29,8.418,7.042,6.382,-0.2,-7.214,-9.603,0.0

30,-1.198,1.801,1.521,1.165,0.495,1.624,1.0

Ответ:

2. С помощью библиотеки sklearn на основе алгоритма k-means производится кластеризация точек на плоскости. Для этого с использованием библиотеки pandas осуществляется загрузка выборки данных из файла data.csv, который содержит значения координат точек (X, Y) исследуемых объектов. При кластеризации используются стандартные параметры алгоритма k-means, кроме n_clusters=2. Требуется определить координаты центра кластера, находящегося ближе к точке с координатами (0, 0). Значение каждой координаты округлить с помощью функции round() до 2 знаков. Примеры записи ответов: «(1.02, -2.04)» или «(-2.02, 2.04)».

Содержимое файла data.csv:

,X,Y

0,0.134,-5.668

1,-0.159,-4.861

2,-4.032,-8.337

3,-5.097,-7.976

4,-0.109,-5.317

5,0.229,-5.927

6,-0.585,-5.189

7,-0.279,-4.604

8,-0.339,-4.814

9,-5.005,-8.143

10,-4.452,-7.995

11,-0.128,-4.544

12,-4.355,-7.544

13,-0.407,-5.747

14,-4.374,-7.872

15,-0.005,-4.672

16,-5.118,-8.872

17,-0.04,-5.482

18,-0.441,-4.682

19,-4.653,-7.372

20,-4.189,-7.477

21,-3.967,-8.718

22,-5.17,-7.566

23,0.387,-4.884

24,-5.729,-7.691

25,-4.756,-8.908

26,-0.097,-5.321

27,-5.149,-8.407

28,-3.692,-7.729

29,0.166,-5.194

Ответ: 


написать администратору сайта