Linux программирование в примерах

Часть 167 из 253 Информация о книге
Функция 
memcpy()
 была первоначальной функцией в System V API для копирования блоков памяти; ее поведение для перекрывающихся блоков памяти не была подробно определена тем или иным способом. Для стандарта С 1989 г. комитет почувствовал, что это отсутствие определенности является проблемой, поэтому они придумали memmove()
. Для обратной совместимости memcpy()
 была оставлена, причем поведение для перекрывающейся памяти было специально отмечено как неопределенное, а в качестве процедуры, корректно разрешающей проблемные случаи, была предложена memmove()
.
Какую из них использовать в своем коде? Для библиотечной функции, которая не знает, какие области памяти ей передаются, следует использовать 
memmove()
. Таким способом вы гарантируете, что не будет проблем с перекрывающимися областями. Для кода приложения, который «знает», что две области не перекрываются, можно безопасно использовать memcpy()
.
Как для 
memcpy()
, так и для memmove()
 (как и для strcpy()
) буфер назначения является первым аргументом, а источник — вторым. Чтобы запомнить это, обратите внимание на порядок, который тот же самый, как в операторе присваивания:
dest = src;
(Справочные страницы во многих системах не помогают, предлагая прототип в виде '
void *memcpy(void *buf1, void *buf2, size_t n)
' и полагаясь на то, что текст объяснит, что есть что. К счастью, справочная страница GNU/Linux использует более осмысленные имена.)
  12.2.3. Сравнение блоков памяти: 
memcmp()
 Функция 
memcmp()
 сравнивает count
 байтов из двух произвольных буферов данных. Возвращаемое ею значение подобно strcmp()
: отрицательное, нулевое или положительное, если первый буфер меньше, равен или больше второго.
Вы можете поинтересоваться: «Почему бы не использовать для такого сравнения 
strcmp()
?» Разница между двумя функциями в том, что memcmp()
 не принимает во внимание нулевые байты (завершающий строку '\0
'.) Таким образом, memcmp()
 является функцией, которая используется, когда вам нужно сравнить произвольные двоичные данные.
Другим преимуществом 
memcmp()
 является то, что она быстрее типичной реализации на C:
/* memcmp --- пример реализации на С, НЕ для реального использования */
int memcmp(const void *buf1, const void *buf2, size_t count) {
 const unsigned char *cp1 = (const unsigned char*)buf1;
 const unsigned char *cp2 = (const unsigned char*)buf2;
 int diff;
 while (count-- != 0) {
  diff = *cp1++ - *cp2++;
  if (diff != 0)
   return diff;
 }
 return 0;
}
Скорость может быть достигнута в результате использования специальных инструкций «блочного сравнения памяти», которые поддерживают многие архитектуры, или в результате сравнения единиц, превышающих байты. (Эта последняя операция коварна, и лучше оставить ее автору библиотеки.)
По этим причинам всегда следует использовать вашу библиотечную версию 
memcmp()
 вместо прокручивания своей собственной. Велика вероятность, что автор библиотеки знает машину лучше вас
  12.2.4. Поиск байта с данным значением: 
memchr()
 Функция 
memchr()
 сходна с функцией strchr()
: она возвращает местоположение определенного значения внутри произвольного буфера. Как и в случае memcmp()
 против strcmp()
, основной причиной для использования memchr()
 является использование произвольных двоичных данных.
GNU 
wc
 использует memchr()
 при подсчете лишь строк и байтов [124], и это позволяет wс
 быть быстрой. Из wc.c
 в GNU Coreutils:
257  else if (!count_chars &amp;&amp; !count_complicated)
258  {
259   /* Использует отдельный цикл при подсчете лишь строк или строк и байтов -
260      но не символов или слов. */
261  while ((bytes_read = safe_read(fd, buf, BUFFER_SIZE)) &gt; 0)
262  {
263   register char *p = buf;
264
265   if (bytes_read == SAFE_READ_ERROR)
266   {
267    error(0, errno, &quot;%s&quot;, file);
268    exit_status = 1;
269    break;
270   }
271
272   while ((p = memchr(p, '\n', (buf + bytes_read) - p)))
273   {
274    ++p;
275    ++lines;
276   }
277   bytes += bytes_read;
278  }
279 }
Внешний цикл (строки 261–278) читает блоки данных из входного файла. Внутренний цикл (строки 272–276) использует 
memchr()
 для поиска и подсчета символов конца строки. Сложное выражение '(buf + bytes_read) - р
' сводится к числу оставшихся байтов между текущим значением p и концом буфера.
Комментарии в строках 259–260 нуждаются в некотором объяснении. Вкратце, современные системы могут использовать символы, занимающие более одного байта в памяти и на диске. (Это несколько более подробно обсуждается в разделе 13.4 «Не могли бы вы произнести это для меня по буквам?».) Таким образом, 
wc
 должна использовать другой код, если она различает байты и символы: этот код имеет дело со случаем подсчета байтов.
  12.3. Временные файлы
 Временный файл является в точности тем, что звучит в его названии: файл, в котором при исполнении программы хранятся данные, которые больше не нужны после завершения программы. 
sort
 читает со стандартного ввода, если в командной строке не указаны файлы или вы используете в качестве имени файла '-
'. Тем не менее, sort
 должна прочесть все
 свои входные данные, прежде чем сможет вывести отсортированные результаты. (Подумайте об этом немного, и вы увидите, что это так.) Когда читается стандартный ввод, данные должны быть где-то сохранены, прежде чем sort
 сможет их отсортировать; это отличное применение для временного файла. sort
 использует временные файлы также для хранения промежуточных результатов сортировки.
Перейти к странице:
Предыдущая страница
Следующая страница