Долго думал куда отправить пост: в сети или дисковые массивы - решил сюда

Ситуация такова.
Есть 3 сервера: S1 - база, S2 - бэкап, S3 - тестовая машинка, используется для сранения. На всех серверах установлена Win2003 Server R2
Стоит задача максимально-быстрого (на данном оборудовании) копирования данных с S1 на S2.
Все три сервера соеденины гигабитной сетью через свитч. Свитч пока слабенький, но на ситуацию не влияет (соединял серверы напрямую кроссовым кабелем - тоже самое).
На S1 и S3 - интегрированные Intel PRO 1000 EB, драйвера последние и одинаковые.
На S2 - Intel PRO 1000 XT
На каждом из серверов есть по массиву: S1A1, S2A1, S3A1
Тесты Iometer (S1A1 и S3A1 на последовательное чтение, S2A1 - последовательную запись) демонстрируют очень понятные и адекватные оборудованию цифры. Конкретные цифры, если будет надо приведу позже. По ним ресурсов у дисковой системы достаточно для обеспечения желаемой скорости передачи данных.
Эксперимент я провожу примитивный - копирование больших файлов (10GB каждый) в программе, что по-русски называется "проводник"

При копировании данных с S1A1 на S2A1 в perfomance monitor`е наблюдаю такую картину:
скорость записи на S2A1 - равномерная пила 10-20 МБайт/Сек
длина очереди на запись (queue length) - равномерная пила от 15 до 30 (!!!)
скорость передачи данных по сети - на первом этапе (неколько секунд) ~40 МБайт/сек, далее ещё несколько секунд ~20 МБайт/сек (я так понимаю забиваются все возможные буферы), далее пила 0-15 МБайт/сек
И совершенно другая картина в следующем тесте - копируем данные с S3A1 на S2A1
скорость записи на S2A1 - достаточно равномерная ~40 МБайт/Сек
длина очереди на запись (queue length) - почти постоянна и равна 2 (!!!)
скорость передачи данных по сети постоянная ~40 МБайт/Сек.
Подскажите пожалуйста, где-что надо посмотреть и где-что надо подкрутить, чтобы процесс копирования с S1A1 работал также как с S3A1?

Описание железок если надо приведу, но что-то мне подсказывает что ковырятся надо в настройках ОС.
Спасибо
Макс