Содержимое файла data csv
Скачать 53.74 Kb.
|
С использованием библиотеки Pandas проводится предварительный анализ данных, содержащихся в файле data.csv. Посредством анализа данных необходимо определить среднее значение параметра A5 для элементов списка, полученных путем отбора данных по условиям А2 > 0 и A3 < 1. Ответ требуется округлить с помощью функции round() до 2 знаков и записать через символ ".". Содержимое файла data.csv: ,A1,A2,A3,A4,A5,A6,C 0,-1.844,-5.724,5.399,-0.726,1.338,3.529,1.0 1,-1.171,-1.522,1.312,-2.735,4.157,1.589,1.0 2,5.073,3.31,2.263,0.627,-6.838,8.14,2.0 3,7.337,8.954,10.078,-0.597,-5.694,-8.924,0.0 4,7.756,9.522,7.073,1.719,-1.941,-7.76,0.0 5,-6.067,-3.552,-2.172,12.055,-1.027,9.196,4.0 6,-6.203,-3.726,-11.737,11.931,-6.474,-5.561,3.0 7,0.427,6.556,5.77,-1.031,-4.622,10.476,2.0 8,-1.855,-0.338,-7.46,10.973,-7.351,-2.017,3.0 9,4.177,8.404,8.455,2.949,-5.022,-11.118,0.0 10,-12.519,-6.159,-1.859,7.161,-3.041,12.971,4.0 11,-4.346,-5.967,-10.505,8.612,-7.295,-8.251,3.0 12,5.387,9.22,2.005,-1.851,-2.511,10.092,2.0 13,-2.612,-0.092,1.167,-2.336,1.411,0.869,1.0 14,4.855,0.748,-0.027,-0.63,-4.996,6.364,2.0 15,-11.13,-7.85,-2.068,7.775,-2.005,9.357,4.0 16,4.062,6.732,1.287,-2.924,-5.362,6.697,2.0 17,-7.395,-7.371,-1.376,9.762,-4.519,10.444,4.0 18,-4.711,-8.054,-3.441,10.949,-7.459,11.293,4.0 19,-3.446,-10.493,-9.346,10.603,-9.213,-5.445,3.0 20,1.199,11.65,3.644,-2.941,-5.09,-12.474,0.0 21,-3.125,-5.717,-9.179,7.047,-8.595,-5.086,3.0 22,-0.721,-1.203,1.881,-2.834,1.11,-0.975,1.0 23,-3.961,-5.308,-7.962,10.168,-4.591,-1.703,3.0 24,7.901,9.31,-1.287,-0.668,-0.954,9.032,2.0 25,10.354,8.928,7.446,0.981,-5.471,-10.855,0.0 26,10.577,10.765,5.761,-2.669,-4.684,-7.322,0.0 27,-0.398,-4.616,-3.928,-1.304,6.197,3.168,1.0 28,-6.942,-2.812,-4.877,7.942,-0.428,8.04,4.0 29,8.418,7.042,6.382,-0.2,-7.214,-9.603,0.0 30,-1.198,1.801,1.521,1.165,0.495,1.624,1.0 Ответ: 2. С помощью библиотеки sklearn на основе алгоритма k-means производится кластеризация точек на плоскости. Для этого с использованием библиотеки pandas осуществляется загрузка выборки данных из файла data.csv, который содержит значения координат точек (X, Y) исследуемых объектов. При кластеризации используются стандартные параметры алгоритма k-means, кроме n_clusters=2. Требуется определить координаты центра кластера, находящегося ближе к точке с координатами (0, 0). Значение каждой координаты округлить с помощью функции round() до 2 знаков. Примеры записи ответов: «(1.02, -2.04)» или «(-2.02, 2.04)». Содержимое файла data.csv: ,X,Y 0,0.134,-5.668 1,-0.159,-4.861 2,-4.032,-8.337 3,-5.097,-7.976 4,-0.109,-5.317 5,0.229,-5.927 6,-0.585,-5.189 7,-0.279,-4.604 8,-0.339,-4.814 9,-5.005,-8.143 10,-4.452,-7.995 11,-0.128,-4.544 12,-4.355,-7.544 13,-0.407,-5.747 14,-4.374,-7.872 15,-0.005,-4.672 16,-5.118,-8.872 17,-0.04,-5.482 18,-0.441,-4.682 19,-4.653,-7.372 20,-4.189,-7.477 21,-3.967,-8.718 22,-5.17,-7.566 23,0.387,-4.884 24,-5.729,-7.691 25,-4.756,-8.908 26,-0.097,-5.321 27,-5.149,-8.407 28,-3.692,-7.729 29,0.166,-5.194 Ответ: |