Прежде чем приступить к обзору возможностей нового
процессора, давайте вспомним, с чего начиналась и как развивалась
IA–32 архитектура. Начнем с процессора Pentium Pro. Он был выпущен
в вариантах с разной тактовой частотой и различными конфигурациями
кэш памяти второго уровня, работающей на полной частоте ядра. Его
хорошо известный приемник, Intel Pentium II, был логическим продолжением,
добавляющим поддержку технологии MMX к ядру P6 и внешний L2 кэш,
работающий на половинной частоте ядра. Pentium III добавляет множество
расширений типа Потоковых SIMD расширений (SSE) для расширения вычислений
с плавающей точкой и злополучный идентификатор процессора, вызвавший
большой резонанс в компьютерных кругах.
Intel Pentium III Coppermine вернул кэш L2 к
работе на полной частоте. Принимая во внимание что Pentium Pro
имел кэш–память, расположенную в корпусе чипа, в новом Pentium
III кэш L2 интегрирован на кристалл, уменьшая стоимость и время
ожидания, приводя тем самым к увеличению производительности.
Процессор Intel Willamette основан на новой 32–х разрядной микроархитектуре.
Помимо интегрированного кэша второго уровня, этот процессор оснащен
новым модулем SSE2 (дальнейшее развитие SSE, используемое в Pentium
III) плюс другие расширения и новшества, позволяющие Willamette
работать на больших тактовых частотах и показывать новые уровни
производительности, заметно превышающие предыдущие поколения процессоров.
Внутренняя организация Willamette
Рассмотрим некоторые из новых особенностей и
их влияние на полную производительность процессора. К сожалению,
пока мы можем довольствоваться только теоретическими представлениями
о производительности. Как только этот процессор появиться в продаже,
мы опубликуем подробный отчет о его тестировании.
SSE2
Willamette добавляет SSE2 (Streaming SIMD Extensions
2) к P6 ядру, состоящему из 76 новых SIMD команд и 68 целочисленных
SIMD команд. Так что теперь мы имеем 144 SIMD команды для работы
с потоковыми вычислениями.
Теперь Intel представляет новую модель программирования, отличную
от модели MMX и SSE, применяемой в предыдущих процессорах. С новыми
SSE2 командами программист получает большую гибкость, поскольку
они позволяют выполнять вычисления с вещественными и целочисленными
данными, а также с упакованными целочисленными данными в регистрах
MMX.
С помощью новых SIMD команд, Intel пробует отойти от одного из
слабых модулей, используемом в современных процессорах —
математического сопроцессора x87. Если рассмотреть ближе производительность
x87 FPU, мы можем видеть, что она строго ограничена старым стандартом.
Улучшение производительности было бы не просто при поддержке его
первоначального дизайна, да и отказываться от него пока нельзя.
Использование SSE2 является хорошим способом обойти этот критический
модуль. Если программисты подрежут использование SSE2 для вычислений
с плавающей точкой, то мы получим SSE2 FPU, работающий в десять
раз быстрее стандартного x87 FPU.
400МГц шина данных и длинный конвейер
С введением в процессоре Willamette нового 20
шагового конвейера, самого длинного когда–либо используемого в
x86 процессорах, Intel нашла способзапустить его на очень высокой
тактовой частоте, более 1.5ГГц. Поскольку команда обрабатывается
постепенно, конвейер с 10 стадиями делит команду на 10 шагов и
занимает 10 тактовых циклов, чтобы обработать всю команду; в течение
каждого цикла заканчивается одна стадия команды. Из–за 20 шагового
конвейера, Willamette занимает 20 циклов для завершения одной
команды, так получается, что за время одного цикла выполняется
в два раза меньшая часть работы по обработке команды.
Число циклов, требуемых для обработки команды, носит название
времени ожидания. Наличие длинных конвейерных средств приводит
к большим задержкам. Чтобы компенсировать потерю производительности
при передачи новой команды из оперативной памяти, все современные
x86 процессоры используют буфер команд. С длинным конвейером и
увеличенным временем ожидания, любая команда, ожидающая в буфере
результата предыдущей команды, будет дольше ждать своего времени.
Поэтому буфер должен быть на одну ячейку больше конвейера.
Как и во всех процессорах с длинными конвейерами, чем лучше предсказание
перехода, тем лучше производительность. Willamette значительно
расширяет алгоритмы, используемые в семействе P6, эффективно объединяя
все доступные сегодня схемы предсказания.
Помимо этого, новый процессор будет использовать 400 МГц
шину данных. Точнее шина остается 100 МГц, но позволяет передавать
в четыре раза больше данных. По словам Intel, такая шина позволит
получить пропускную способность до 3.2GB/сек, что в три раза больше,
чем у сегодняшнего Pentium III.
Высокоскоростной ALU (арифметико–логическое
устройство)
Целочисленные команды обрабатываются в ALU.
Willamette использует новый подход уменьшения времени ожидания
некоторых целочисленных команд, чтобы компенсировать более длинный
конвейер. Обычно ALU обрабатывает команду только на повышающей
стадии тактового цикла, Willamette эффективно использует еще и
падающую стадию цикла, эффективно удваивая (3ГГц) скорость обработки
некоторых команд.
Trace Cache
Другой элемент увеличивающий производительность —
Trace Cache, пробует сохранить команды в последовательности их
выполнения. Например, если команда А переходит в позиции 100 к
команде B позиции 200, trace cache сохранит B в позиции справа
после A. Так что trace cache упрощает обработку, убеждаясь, что
команды расположены в правильной последовательности.
Совместимость
Даже при том, что Willamette основан на новой
архитектуре, он будет полностью совместим с существующими приложениями
IA–32 и всеми операционными системами.
Заключение
Хотя это будет первый процессор, превосходящий
1.5 ГГц отметку, из–за длинного конвейера и больших задержек,
фактическое увеличение производительности по сравнению с Pentium
III Coppermine не будет такой значительной. Единственный путь
превратить его в самый производительный x86 процессор, дать программистам
достаточно стимула для использования SSE2 для вещественных вычислений.
Нам остается только надеяться на то, что наши предположения и
ожидания сбудутся в скором времени, и мы сможем увидеть действительно
новый высокопроизводительный процессор от Intel.
Сервера для малых предприятий на базе процессоров
Intel
Интернет, локальные сети, корпоративная электронная
почта — все эти коммуникационные средства стали незаменимы
в современных бизнес–процессах. Бесперебойное поступление и обмен
информацией во многом обусловлено надежностью сервера и его соответствием
текущей нагрузке. В рамках своего серверного направления компания
Desten Computers является производителем широкого спектра серверов,
отвечающего потребностям как малого и среднего бизнеса, так и
крупных предприятий.
В частности, DSTN Navigator–S6500DP — это
типичная модель для малого бизнеса и информационных отделов (относится
к классу серверов начального уровня). Сервер, построенный на базе
системной платы Intel L440GX+, позволяет установку до 2–х процессоров
Pentium III с тактовой частотой до 600 МГц и кэшем L2 емкостью
512 Кбайт. На плате интегрированы шесть слотов PCI и один
ISA, контроллер USB, сетевой адаптер Fast Ethernet Intel PRO/100+,
а также высокопроизводительный контроллер SCSI Adaptec AIC–7896.
Две равноправные шины PCI и поддержка плат PCI 66 МГц позволяют
радикально повысить производительность PCI — она может быть
в три раза выше, чем у традиционных двухпроцессорных серверов.
Естественно, серверная платформа оснащена развитой системой контроля
и управления: специализированным процессором управления сервером,
управляющим ПО Intel Server Control, портом аварийного управления
и функцией Platform Event Paging. Сервер смонтирован на шасси
Astor–II: оборудован пятью отсеками для жестких дисков с интерфейсом
U2WSCSI с «горячей заменой», одним источником питания
мощностью 300 Вт и имеет два внутренних 5,25–дюймовых отсека.
Типовая конфигурация с одним процессором Pentium III 500 МГц (кэш
L2 — 512 Кбайт) и 128 Мбайт ОЗУ PC100 ECC обойдется заказчику
ориентировочно в 1635 долл.
Для консультаций и приобретения
обращайтесь в центральный офис Desten
Computers по адресу: Москва, пр–т М. Жукова 2, под. 2.
Тел./факс: 785-1080/81/82.