Насчет SSE2.
Интел выложил исходники библиотеки математических функций (на FTP и вроде на developer.intel.com есть тоже), оптимизированной под SSE/SSE2. Если не ошибаюсь, AMaths.zip
Предлагаю желающим ознакомиться, могу выслать на e-mail.
В режиме тестирования программа выдает сводную таблицу, в которой содержатся времена выполнения тестов и погрешность для вычислений с плавающей точкой, SSE и SSE2.
У меня на P4-1500 по напечатанным результатам преимущество в скорости SSE2 перед обычным сопроцессором где-то в 10-12 раз (я не шучу), при незначительной потере точности (не более 0.008%)
Добавлено
sailor
3-4 раза - это не чушь. Скорость вычисления например тригонометрических функций выше, чем ТАБЛИЧНЫЙ метод, т.е. просто поиск в таблице заранее вычисленного значения.
Интел выложил исходники библиотеки математических функций (на FTP и вроде на developer.intel.com есть тоже), оптимизированной под SSE/SSE2. Если не ошибаюсь, AMaths.zip
Предлагаю желающим ознакомиться, могу выслать на e-mail.
В режиме тестирования программа выдает сводную таблицу, в которой содержатся времена выполнения тестов и погрешность для вычислений с плавающей точкой, SSE и SSE2.
У меня на P4-1500 по напечатанным результатам преимущество в скорости SSE2 перед обычным сопроцессором где-то в 10-12 раз (я не шучу), при незначительной потере точности (не более 0.008%)
Добавлено
sailor
3-4 раза - это не чушь. Скорость вычисления например тригонометрических функций выше, чем ТАБЛИЧНЫЙ метод, т.е. просто поиск в таблице заранее вычисленного значения.