В роли выходных анализируемых величин выступают следующие параметры:
Примечание:
Тестирование проводилось на существенном объеме файлов, параметры данных в каждом файле однозначно определяются комбинацией из четырех характеристик:
В таблицах ниже подробно описано содержание каждой из них.
№ | Расширение | Описание | Технология импрот/экспорт* |
---|---|---|---|
1 | .xlsx | Лист MS Excel 2007 | OleDB/Native |
2 | .xls | Лист MS Excel 2003 | OleDB/Native |
3 | .dbf | Таблица в формате dBase, FoxPro (версия FoxBASE+/dBASE III PLUS) | OleDB/Native |
4 | .txt | Текстовый файл с фиксированными столбцами | Native/Native |
5 | .csv | Файл с разделителями | Native/Native |
6 | .ddf | Deductor Data File | Native/Native |
Примечания:
№ | Данные | Количество полей | |||
---|---|---|---|---|---|
1 | Дробные числа от 0 до 1 c точностью 9 знаков после запятой | 1 | 4 | 8 | 16 |
2 | Целые девятизначные числа | ||||
3 | Даты в формате ДД.ММ.ГГГГ | ||||
4 | Строки: с повторениями, 100 уникальных значений (используется справочник стран) | ||||
5 | Строки: 50 случайных символов (диапазон кодовых десятичных значений ANSI-кодировки: 50-150) |
№ | Этап тестирования | Мин | Макс | Шаг |
---|---|---|---|---|
1 | 10 тыс. – 100 тыс. записей | 10 тыс. | 100 тыс. | 10 тыс. |
2 | 200 тыс. – 1 млн. записей | 200 тыс. | 1 млн . | 200 тыс. |
3 | 2 млн. – 10 млн. записей | 2 млн. | 10 млн | 2 млн. |
В ходе тестирования для некоторых источников данных были обнаружены следующие ограничения:
Учитывая описанные выше ограничения и для получения наиболее корректных результатов, тестирование было разбито на несколько этапов в зависимости от объема тестируемых данных:
Таким образом мы однозначно уверены, что файлы различаются только форматом хранения данных, но содержат одну и ту же информацию.