Главная страница

Обработка массива целых чисел из файла. Сортировка


Скачать 315.5 Kb.
НазваниеОбработка массива целых чисел из файла. Сортировка
Дата23.05.2022
Размер315.5 Kb.
Формат файлаdoc
Имя файлаege26.doc
ТипДокументы
#546036
страница1 из 4
  1   2   3   4

© К. Поляков, 2020–2021

26 (высокий уровень, время – 35 минут)


Тема: Обработка массива целых чисел из файла. Сортировка.

Что проверяется:

Умение обрабатывать целочисленную информацию с использованием сортировки.

1.6.3. Построение алгоритмов и практические вычисления.

1.1.3. Строить информационные модели объектов, систем и процессов в виде алгоритмов.

Что нужно знать при написании программы:

Чтение данных из файла

  • в языке Python для чтения данных удобно использовать менеджер контекста (with ... as), который открывает файл и закрывает его; например, код

with open("26.txt") as Fin: # программа и файл в одной папке

... # какие-то операции с файлом

# при завершении работы менеджера контекста

# файл автоматически закрывается

равносилен такому

Fin = open("26.txt") # открытие файла

... # какие-то операции с файлом

Fin.close() # закрытие файла

  • если в текущей строке файла находится целое число, то прочитать его в переменную x можно так:

x = int( Fin.readline() )

  • если в строке записаны два числа, после чтения (Fin.readline()) строку нужно разбить на отдельные части по пробелам между числами (каждая часть – символьная запись числа) и затем каждую часть преобразовать в целое число; например, чтение двух чисел:

s = Fin.readline()

symData = s.split()

x, y = map( int, symData )

или в компактной форме

x, y = map( int, Fin.readline().split() )

  • в языке PascalABC.NET для чтения данных проще всего просто перенаправить входной поток на файл:

Assign( input, '26.txt' );

после этого можно использовать операторы read и readln, так же, как при вводе с клавиатуры

  • в языке C++ можно читать данные с помощью входного потока (fstream):

#include

...

ifstream Fin("26.txt");

Fin >> x;

Fin >> y >> z;

Хранение массива данных

  • в языке Python для хранения массива данных используется список; следующая программа показывает чтение массива данных размера N в список data из файла «26.txt» (данные записаны в столбик, по одному числу в строке):

data = [0]*N

with open("26.txt") as Fin:

for i in range(N):

data[i] = int( Fin.readline() )

или с помощью генератора списка

with open("26.txt") as Fin:

data = [ int( Fin.readline() )

for i in range(N) ]

  • в языке PascalABC.NET используем динамический массив; когда станет известен его размер, выделаем место в памяти и читаем из входного потока:

var data: array of integer;

SetLength( data, N );

for var i:=0 to N-1 do

read( data[i] );

  • в языке C++ аналогично используется коллекция vector:

#include

...

vector data(N);

for( int i = 0; i < N; i++ )

Fin >> data[i];

Сортировка массива

  • Для сортировки имеет смысл использовать встроенные функции языков программирования. Категорически НЕ рекомендуется писать собственные реализации алгоритмов сортировки.

  • В языке Python для сортировки массива (списка ) «на месте» вызывается метод sort:

data.sort()

при этом числа сортируются по возрастанию. Для сортировки по убыванию в вызов метода добавляем именованный аргумент reverse со значением True:

data.sort( reverse = True )

Для сортировки по другому критерию (например, по последней цифре числа) добавляют именованный аргумент key, который указывает на функцию, вычисляющую нужно значение, например:

def lastDigit( n ):

return n % 10

... # заполнение массива data

data.sort( key = lastDigit )

Простую функцию можно не оформлять как отдельную подпрограмму, а записать как неименованную функцию (лямбда-функцию) :

data.sort( key = lambda x: x % 10 )

Иногда данные в массиве дата представляют собой пары или тройки чисел, объединённые в кортежи. В этом случае при стандартной сортировке сначала сравниваются первые элементы кортежей, если они равны – вторые и т.д. Чтобы задать свой порядок сортировки, нужно использовать аргумент key с обычной функцией или лямбда-функцией. Например,

data.sort( key = lambda x: (-x[1], x[0]%10) )

В этом примере происходит сортировка по убыванию (знак «минус») второго числа в кортеже, x[1], а если вторые элементы равны - по возрастанию последней цифры первого элемента кортежа, x[0].

Если нужно создать новый массив, не изменяя исходные данные, используется функция sorted. Её первый аргумент – массив, а остальные совпадают с аргументами метода sort. Например,

data1 = sorted( data, key = lambda x: (-x[1], x[0]%10) )

  • В языке PascalABC.NET для динамических массивов используется метод Sort:

data.Sort;

По умолчанию сортировка выполняется в порядке возрастания.

Для нестандартной сортировки лучше использовать метод OrderBy, в качестве аргумента можно указать лямбда-функцию. При этом строится новый массив. Вот пример с сортировкой по возрастанию последней цифры числа:

var data1 := data.OrderBy( x->x mod 10).ToArray;

Если нужна сортировка по убыванию, вместо OrderBy применяется метод OrderByDescending.

  • в языке C++ для сортировки коллекции vector вызывается процедура sort (сортировка «на месте»):

#include

...

vector data(N);

...

sort( data.begin(), data.end() );

Для сортировки по убыванию третьим аргументом указывается функция greater:

sort( data.begin(), data.end(), greater() );

Нестандартную формировку можно выполнить с помощью собственной функции сравнения. Вот, например, сортировка вектора по возрастанию последней цифры:

bool cmpLastDigit( int i1, int i2)

{

return (i1 % 10 < i2 % 10);

}

...

sort( data.begin(), data.end(), cmpLastDigit );

Можно использовать и аналогичную лямбда-функцию:

sort( data.begin(), data.end(),

[]( int i1, int i2) { return (i1 % 10 < i2 % 10); } );

Пример задания:


Р-00 (демо-2021). Системный администратор раз в неделю создаёт архив пользовательских файлов. Однако объём диска, куда он помещает архив, может быть меньше, чем суммарный объём архивируемых файлов. Известно, какой объём занимает файл каждого пользователя. По заданной информации об объёме файлов пользователей и свободном объёме на архивном диске определите максимальное число пользователей, чьи файлы можно сохранить в архиве, а также максимальный размер имеющегося файла, который может быть сохранён в архиве, при условии, что сохранены файлы максимально возможного числа пользователей.

Входные данные. В первой строке входного файла 26.txt находятся два числа: S – размер свободного места на диске (натуральное число, не превышающее 100 000) и N – количество пользователей (натуральное число, не превышающее 10000). В следующих N строках находятся значения объёмов файлов каждого пользователя (все числа натуральные, не превышающие 100), каждое в отдельной строке. Запишите в ответе два числа: сначала наибольшее число пользователей, чьи файлы могут быть помещены в архив, затем максимальный размер имеющегося файла, который может быть сохранён в архиве, при условии, что сохранены файлы максимально возможного числа пользователей.

Пример входного файла:

100 4

80

30

50

40

При таких исходных данных можно сохранить файлы максимум двух пользователей. Возможные объёмы этих двух файлов 30 и 40, 30 и 50 или 40 и 50. Наибольший объём файла из перечисленных пар – 50, поэтому ответ для приведённого примера:

2 50

Здесь и далее во всех задачах этого класса предполагается, что не все файлы могут быть сохранены на диске, то есть хотя бы для одного файла места не хватит.

Решение (электронные таблицы, А. Сидоров, www.youtube.com/watch?v=LwTZAHsno0k ):

  1. сначала загружаем данные в электронную таблицу; тут есть два способа:

  1. открыть файл в Блокноте, выделить всё с помощью клавиш Ctrl+A, скопировать в буфер обмена, а затем вставить в электронную таблицу

  2. выбрать пункт меню Файл – Открыть, в окне выбора файла выбрать «Все файлы», и затем выбрать нужный файл; при этом запустится мастер импорта, который загрузит данные в таблицу (он задаст пару вопросов, можно везде нажимать кнопку Далее)

вот что должно получиться:



  1. для удобства хочется удалить первую строку, которая содержит не такие данные, как все остальные;

  2. из первой строки нам нужно число 8200 – это размер свободного места на диске; это число нужно запомнить или где-то записать на бумажке или в ячейке электронной таблицы (только не в первой строке, которая будет удалена); затем удаляем первую строку

  3. для того чтобы разместить наибольшее количество файлов, нужно начинать с самых маленьких, то есть данные в первом столбце нужно отсортировать по возрастанию; щёлкнем по заголовку столбца А, чтобы выделить его, и отсортируем:



  1. далее начинаем выделять ячейки первого столбца, отслеживая значение суммы в строке состояния



Можно также внести в B1 число из A1, а в B2 – формулу = B1 + A2, и протащить её вниз за маркер заполнения до получения максимальной суммы ≤ 8200.

  1. нужно выделить наибольшее количество данных, сумма которых не больше, чем 8200:



  1. если (см. рисунок) выделить еще одно число, сумма 8206 уже превысит 8200, что недопустимо; поэтому первый ответ – 568

  2. у нас есть запас  = 8200 – 8176 (текущая сумма) = 24

  3. для того чтобы ещё увеличить сумму (но сохранить её не превышающей 8200) мы заменим одно из выделенных значений другим, бо́льшим;

  4. докажем, что нужно заменять именно самое большое из выбранных значений; пусть мы заменяем значение, равное x, бо́льшим значением, равным X; чтобы сумма не превысила заданную, их разница не должна быть больше, чем , то есть Xx + ; таким образом, при бо́льшем x мы можем взять бо́льшее X

  5. наш запас 8200 – 8176 (текущая сумма) = 24, поэтому вместо самого большого взятого значения 29 можно добавить 29 + 24 = 53

  6. смотрим в таблицу – значения 53 у нас нет, сразу за 50 идёт 70:



  1. поэтому второй ответ – 50

  2. Ответ: 568 50

Решение (программа):

  1. проще всего составить программу на языке Python, где есть много встроенных функций

  2. сначала нужно прочитать данные из файла; читаем все строки сразу в массив data:

with open("26.txt") as Fin:

data = Fin.readlines()

  1. декодируем два числа из первой строки; первой записываем в переменную S, а второе нам не интересно, записываем его в переменную с именем «_»; первую строку сразу удаляем

S, _ = map( int, data[0].split() )

del data[0]

  1. преобразуем данные в целые числа и сразу сортируем

data = sorted( list(map(int, data)) )

  1. теперь накапливаем сумму в переменной total, пока она остается не больше, чем S:

total = 0

for i, val in enumerate(data):

if total + val > S: break

total += val

  1. как только сумма превысила S, произойдёт выход из цикла по оператору break, а в переменной i останется количество добавленных значений; выводим его на экран:

print(i)

  1. вычисляем запас, который мы можем уменьшить с помощью замены одного выбранного значения на другое:

delta = S - total

  1. теперь выбираем из массива данных те значения, которые могут быть выбраны: разность между таким значением и наибольшим выбранным элементом data[i] должна быть не больше, чем delta:

candidates = [x for x in data

if x-data[i-1] <= delta]

  1. остается найти второй ответ: максимум из чисел-кандидатов:

print( max(candidates) )

  1. приведём полную программу

with open("26.txt") as Fin:

data = Fin.readlines()

S, _ = map( int, data[0].split() )

del data[0]

data = sorted( list(map(int, data)) )
total = 0

for i, val in enumerate(data):

if total + val > S: break

total += val

print(i)
delta = S - total

candidates = [x for x in data

if x-data[i-1] <= delta]

print( max(candidates) )

  1. аналогичная программа на языке PascalABC.NET:

var S, N: integer;

data: array of integer;

begin

Assign( input, '26.txt' );

readln( S, N );

SetLength( data, N );

for var i:=0 to N-1 do

read( data[i] );

Sort( data );

var total := 0;

var count := 0;

while count < N-1 do begin

if total + data[count] > S then break;

total += data[count];

count += 1;

end;

var delta := S - total;

var candidates := data.Where(

x -> x - data[count-1] <= delta );

Println( count, candidates.Max )

end.

  1. ещё одно решение на PascalABC.NET (С. Михалкович)

begin

  Assign(input, '26.txt');

  var (S,N) := ReadInteger2;

  var data := ReadArrInteger(N);

  Sort(data);

  var (total,count) := (0,0);

  while (count < N) and (total + data[count] <= S) do

  begin

    total += data[count];

    count += 1;

  end;

  var delta := S - total;

  Println(count, data.Last(x -> x - data[count-1] <= delta));

end.

  1. аналогичная программа на языке C++:

#include

#include

#include

#include
using namespace std;

int main()

{

ifstream Fin("26.txt");

int S, N, x;

Fin >> S >> N;

vector data(N);
for( int i = 0; i < N; i++ )

Fin >> data[i];
sort( data.begin(), data.end() );

int total = 0, count;

for( count = 0; count < N; count++ ) {

if( total + data[count] > S ) break;

total += data[count];

}

int delta = S - total;

int maxCandidate = 0;

for( int i = count; i < N; i++ ) {

if( data[i] - data[count] <= delta )

if( data[i] > maxCandidate )

maxCandidate = data[i];

}

cout << count << " " << maxCandidate;

}
  1   2   3   4


написать администратору сайта