Спасибо. Результат интересный.  
1. При отключении синхронизации с stdio и привязки cin к cout "старый медленный" вариант оказался куда быстрее "старого быстрого" (с доп. буфером). Без этого он был в 5-6 раз медленнее.
2. При уравнивании шансов (т.е. при аналогичном отключении синхронизации и привязки в "старом быстром" варианте) получилось: вариант с буфером в 2-2.5 раза быстрее варианта с "прямым отправлением" в стандартный поток вывода.
  
Использованные манипуляции ускоряют программу в 8-10 раз (но соотношение между вариантами сохраняется, хотя отрыв и сокращается).
		
		1. При отключении синхронизации с stdio и привязки cin к cout "старый медленный" вариант оказался куда быстрее "старого быстрого" (с доп. буфером). Без этого он был в 5-6 раз медленнее.
2. При уравнивании шансов (т.е. при аналогичном отключении синхронизации и привязки в "старом быстром" варианте) получилось: вариант с буфером в 2-2.5 раза быстрее варианта с "прямым отправлением" в стандартный поток вывода.
Использованные манипуляции ускоряют программу в 8-10 раз (но соотношение между вариантами сохраняется, хотя отрыв и сокращается).

 Вывод на экран - долгая операция. 2-2.5 раза - это не очень много