CodeNet / Приложения / Алгоритмы / Структуры данных
Структуры с меняющимися размерами данных
27 апреля 2007 года
В разных форумах по программированию на C++ регулярно задаются вопросы: как записать структуру с текстовыми полями в бинарный файл, а затем прочитать её оттуда? Типичной ошибкой для начинающих программистов является попытка записать напрямую в файл структуру, содержащую указатели на текстовые строки. В итоге в файл записываются лишь значения указателей, но не сами строки.
Возьмём в качестве примера небольшую структуру, в которой используются классы CString для текстовых данных:
typedef struct _CUSTOM_DATA
{
CString strName; // Имя
CString strFamily; // Фамилия
CString strAddress; // Адрес
CString strCompany; // Компания
CString strMailBox; // Почта
} CUSTOM_DATA, *LPCUSTOM_DATA;
В таком виде структура удобна для обмена данными внутри приложения, например: ввод информации через графический интерфейс, запись в таблицу СУБД, вывод в отчётный документ или экспорт в текстовый файл, и т.д. Но для записи в бинарный файл такая структура неприемлема, поскольку класс CString содержит лишь указатель на символьный массив, а сам текст находится вне класса. Тогда каким же образом текстовые данные можно записать из данной структуры в бинарный файл, а затем прочитать их из файла обратно в структуру? Для этого используются так называемые структуры с меняющимся размером данных, у которых фиксированный размер имеет лишь начало структуры (заголовок), а за ним располагаются сами данные в определённой последовательности.
Выглядит структура так:
typedef struct _CUSTOM_DATA_PERSIST
{
DWORD dwDataSize;
WORD wOffsetName;
WORD wOffsetFamily;
WORD wOffsetAddress;
WORD wOffsetCompany;
WORD wOffsetMailBox;
TCHAR tcStrData[1];
} CUSTOM_DATA_PERSIST, *LPCUSTOM_DATA_PERSIST;
Суть в том, что для инициализации такой структуры нужно сначала определить размер всех данных, которые будут записываться в файл. Т.е. необходимо узнать длину каждой строки вместе с нулевым символом на конце, сложить их вместе, прибавить к этому значению размер заголовка структуры, а затем выделить в памяти массив соответствующего размера, в котором разместятся эти данные. Текстовые строки в массиве располагаются последовательно одна за другой, разделённые нулевыми символами, а в заголовке структуры для каждой строки указываются смещения от начала первой строки. Ещё необходимо в заголовке структуры указать размер всего массива данных, чтобы потом при чтении данных из файла, можно было заранее выделить для них массив нужного размера. В таком виде эта структура записывается в файл. При чтении структуры из файла, чтобы получить указатель на нужную строку, надо прибавить к значению указателя на первую строку величину смещения для нужной строки.
Как же тогда пользоваться такой структурой для обмена данными в приложении, если процесс её инициализации и обращения к ней выглядит таким сложным и трудоёмким? А не нужно её для этого использовать. Такие структуры следует применять лишь для хранения данных в файле, для передачи данных по сети или для локального обмена данными между приложениями. А для передачи данных внутри приложения следует пользоваться более простым и удобным вариантом первой структуры. Т.е. фактически для одних и тех же данных нужно определить два типа структур. При записи данных в файл и при чтении их из файла необходимо реализовать процедуру передачи данных из одной структуры в другую.
Вот как это выглядит в коде на C++:
#include "stdafx.h"
#include <stdio.h>
typedef struct _CUSTOM_DATA
{
CString strName; // Имя
CString strFamily; // Фамилия
CString strAddress; // Адрес
CString strCompany; // Компания
CString strMailBox; // Почта
} CUSTOM_DATA, *LPCUSTOM_DATA;
typedef struct _CUSTOM_DATA_PERSIST
{
DWORD dwDataSize;
WORD wOffsetName;
WORD wOffsetFamily;
WORD wOffsetAddress;
WORD wOffsetCompany;
WORD wOffsetMailBox;
TCHAR tcStrData[1];
} CUSTOM_DATA_PERSIST, *LPCUSTOM_DATA_PERSIST;
int SaveDataToFile(LPCUSTOM_DATA data, LPCTSTR szFile)
{
ATLASSERT (data != NULL);
CUSTOM_DATA_PERSIST pers;
pers.wOffsetName = 0;
pers.wOffsetFamily = pers.wOffsetName + ::lstrlen(data->strName) + 1;
pers.wOffsetAddress = pers.wOffsetFamily + ::lstrlen(data->strFamily) + 1;
pers.wOffsetCompany = pers.wOffsetAddress + ::lstrlen(data->strAddress) + 1;
pers.wOffsetMailBox = pers.wOffsetCompany + ::lstrlen(data->strCompany) + 1;
DWORD dwStrLen = pers.wOffsetMailBox + ::lstrlen(data->strMailBox);
pers.dwDataSize = dwStrLen * sizeof(TCHAR) + sizeof(pers);
// Создание массива и заполнение его данными...
LPCUSTOM_DATA_PERSIST lpDataPers =
(LPCUSTOM_DATA_PERSIST)(new BYTE[pers.dwDataSize]);
*lpDataPers = pers;
::lstrcpy(lpDataPers->tcStrData + pers.wOffsetName, data->strName);
::lstrcpy(lpDataPers->tcStrData + pers.wOffsetFamily, data->strFamily);
::lstrcpy(lpDataPers->tcStrData + pers.wOffsetAddress, data->strAddress);
::lstrcpy(lpDataPers->tcStrData + pers.wOffsetCompany, data->strCompany);
::lstrcpy(lpDataPers->tcStrData + pers.wOffsetMailBox, data->strMailBox);
// Запись массива в файл...
int nResult(0);
FILE *file(NULL);
_tfopen_s(&file, szFile, _T("wb"));
if (file != NULL)
{
fwrite(lpDataPers, 1, pers.dwDataSize, file);
fclose(file);
} else
{
nResult = -1;
}
delete lpDataPers;
//
return nResult;
}
int LoadDataFromFile(LPCUSTOM_DATA data, LPCTSTR szFile)
{
ATLASSERT (data != NULL);
CUSTOM_DATA_PERSIST pers;
//
int nResult(0);
FILE *file(NULL);
_tfopen_s(&file, szFile, _T("rb"));
if (file != NULL)
{
// Считываем заголовок структуры и создаём массив...
fread(&pers, sizeof(pers), 1, file);
LPCUSTOM_DATA_PERSIST lpDataPers =
(LPCUSTOM_DATA_PERSIST)(new BYTE[pers.dwDataSize]);
*lpDataPers = pers;
// Потом дочитываем остальные данные...
fread((LPBYTE)lpDataPers + sizeof(pers), 1,
pers.dwDataSize - sizeof(pers), file);
fclose(file);
// Передача данных в другую структуру...
data->strName = lpDataPers->tcStrData + lpDataPers->wOffsetName;
data->strFamily = lpDataPers->tcStrData + lpDataPers->wOffsetFamily;
data->strAddress = lpDataPers->tcStrData + lpDataPers->wOffsetAddress;
data->strCompany = lpDataPers->tcStrData + lpDataPers->wOffsetCompany;
data->strMailBox = lpDataPers->tcStrData + lpDataPers->wOffsetMailBox;
//
delete lpDataPers;
} else
{
nResult = -1;
}
return nResult;
}
// Для вывода текста на консоль...
BOOL PrintText(LPCTSTR szText);
// Применение функций записи в файл и чтения из файла,
// отображение полученных данных...
int _tmain(int argc, _TCHAR* argv[])
{
// Инициализация структуры...
CUSTOM_DATA data =
{
_T("Виталий Сергеевич"),
_T("Рычков"),
_T("129329, г. Москва, ул Кольская, д. 11"),
_T("WinMain &Co Ltd"),
_T("rychkov@inbox.ru")
};
LPCTSTR szFile = _T("WinMain.bin");
// Запись данных в файл...
SaveDataToFile(&data, szFile);
// Чтение данных из файла...
CUSTOM_DATA dataNew;
LoadDataFromFile(&dataNew, szFile);
// Вывод данных на консоль...
PrintText(dataNew.strFamily);
_puttc('\n', stdout);
PrintText(dataNew.strName);
_puttc('\n', stdout);
PrintText(dataNew.strAddress);
_puttc('\n', stdout);
PrintText(dataNew.strCompany);
_puttc('\n', stdout);
PrintText(dataNew.strMailBox);
_puttc('\n', stdout);
// Ожидание...
_gettc(stdin);
return 0;
}
BOOL PrintText(LPCTSTR szText)
{
static HANDLE hConsole = ::GetStdHandle(STD_OUTPUT_HANDLE);
// Вывод текста на консоль...
DWORD dw(0);
return ::WriteConsole(hConsole, szText, ::lstrlen(szText), &dw, NULL);
}
Представленный пример выполнен в среде Visual C++ 2005. Для его повторения нужно с помощью <визарда> создать проект приложения Win32 Console, включив опцию поддержки ATL.
