ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 진화를 거듭한 샌디 브릿지, 2세대 인텔 코어 프로세서 (1155 와 1156 비교)
    정보얻기/정보 2011. 1. 7. 11:20
    반응형

    안녕하세요 1156 핀이 나온지 1년이 넘어가는 시점에서 1156의 단점을 보완한 1155가 나오는군요 (ㅠ.ㅠ)
    앞으로 2세대 인텔코어 프로세서가 대세가 될 전망입니다. -_-;;;
    하긴 1년 잘 썼으니... (그래도 우울하네요... ㅜ.ㅜ)
    내용한번 보시구요 특정 프로그램에서 10% 이상 빠르네요 
    램은 DDR3을 사용하겠죠? ^^
    삼성에서 나온 DDR4를 사용하려면 1년을 더 기다려야 하니 그때는 다른 시피유가 나올까요?

    진화를 거듭한 샌디 브릿지, 2세대 인텔 코어 프로세서
    곽준혁 2011/01/05
    1.샌디 브릿지, 코어 시리즈의 대를 잇다

    인텔의 1세대 코어 시리즈는 기본적으로 네할렘 아키텍처를 쓴 프로세서들이다. 이 때 처음 선보인 프로세서로 하이엔드 사용자 층을 노린 블룸필드가 있고, 아키텍처를 조금씩 수정한 린필드, 32nm 공정이 사용된 클락데일 순으로, 약 2년에 걸쳐 코어 시리즈의 기본 라인업을 다졌다.

    이제 인텔은 이들의 뒤를 이을 새로운 2세대 코어 시리즈, 샌디 브릿지 프로세서를 출시했다. 샌디 브릿지 프로세서는 기존에 판매되던 1세대 코어 시리즈와는 달리, 다른 구조의 아키텍처를 적용했기에 성능과 효율면에서 상당한 개선이 있을 것으로 예상하고 있다. 인텔도 이번에 출시한 샌디 브릿지 프로세서를 통해, 지금보다 한 단계 높아진 완성도를 보여 줄 것이라 관망하는 분위기다.

    경쟁사인 AMD도 차세대 프로세서인 불도저를 언급한 상황이지만, 아직 시기상으로는 한 발 물러 선 위치에 있다. 아키텍처의 개선, 기존의 프로세서보다 더 작은 치수의 공정을 적용했다는 점은 샌디 브릿지 프로세서의 주요 내용과 같지만, 바로 사용할 수 있는 제품으로 공급되려면, 최소 3~4개월 이상은 더 걸릴 테니 말이다.

    이로 보면, 인텔의 샌디 브릿지 프로세서는 이보다 먼저 출시된 제품으로, 시스템의 세대 교체에 적잖은 영향을 끼칠 것으로 보인다. 대표적인 예를 꼽는다면, 샌디 브릿지가 시장에 풀리기 한 달 전부터 6시리즈 메인보드가 팔렸다는 점이 되겠다. 보통은 프로세서와 메인보드가 동시에 출시되는 것이 원칙이지만, 언제부턴가 샌디 브릿지에 무게가 지속적으로 실리기 시작했다. 그래서 오늘은 2세대 코어 시리즈, 인텔의 샌디 브릿지 프로세서를 만나는 시간을 가졌다.

    2.성능과 효율성을 겸비한 아키텍처

    여태 선보인 1세대 코어 시리즈와 구분되는 특징은 공정과 아키텍처다. 1세대 코어 시리즈에서는 코어2 듀오/쿼드 시리즈(펜린)에서 사용된 45nm 공정과 네할렘 아키텍처를 주로 사용했다. 그러던 1년 후에는 32nm 공정으로 바뀐 웨스트메어로 접어들며, 헥사코어 프로세서인 걸프타운, 프로세서 안에 그래픽 코어가 내장된 클락데일 프로세서를 접하게 됐다. 이 시기는 2세대 코어 시리즈로 넘어가기 위한 발판이 됐다. 샌디 브릿지 프로세서는 어떤 변화점이 있는 것일까?

     

    1. 32nm 공정으로 그래픽 코어를 통합한 샌디 브릿지

    이는 샌디 브릿지 프로세서에서 겉보기로 드러나는 특징이다. 클락데일에서는 멀티 칩 패키지(Multi-Chip Package)라 하여, CPU 코어와 그래픽 코어의 영역이 각각 분리된 구조를 나타냈다. CPU는 32nm, 그래픽 코어는 45nm 공정으로 제작돼, 서로 다른 역할을 하는 두 개의 코어가 하나의 프로세서에 위치한 형태를 이룬다.

    하지만, 샌디 브릿지에 와서는 CPU 코어와 그래픽 코어가 통합된 구조를 보인다. 32nm 공정으로 제작된 CPU 코어의 일부 영역에 그래픽 코어를 만입시켜, 원 칩 패키지(One-Chip Package) 형태를 갖춘 것이다. 이 변화가 뜻하는 것은 두 개의 코어를 오가던 그래픽 데이터의 전송로 길이가 짧아진 것을 의미하기 때문에 결과적으로 성능 향상을 가져올 수 있다.

    물론, 샌디 브릿지 프로세서에 내장된 그래픽 코어의 제원도 이전보다 향상됐다. 다이렉트X 10.1 그래픽 환경을 비롯, Open GL 3.0 엔진과 쉐이더 모델 4.1을 지원하고, 그래픽 코어의 동작 속도 또한 최대 1,350MHz로 올라, 게임에서의 성능 향상이 도드라질 것으로 보인다. HDMI 1.4를 통한 블루레이 3D 지원 등 여러 혜택이 추가됐는데, 그래픽 유닛 수에서는 지난 세대와 큰 차이를 보이지 않는다.

    주목해야 할 것은 세부 모델에 따라 그래픽 유닛 수가 다르게 적용된다는 점이다. 데스크탑 PC를 기준으로, 일반적인 샌디 브릿지 프로세서의 모델명이 기재된 경우는 6개, 모델명 뒤에 K가 붙은 프로세서는 12개의 스트림 프로세서를 사용한다. 이들은 각각 인텔 HD 그래픽 2000과 인텔 HD 그래픽 3000으로 불린다. 하지만, 노트북 PC를 기준한 샌디 브릿지 프로세서는 모델명에 관계없이 인텔 HD 그래픽 3000이 내장된다. 이는 데스크탑 PC보다 업그레이드가 어렵다는 점을 고려한 선택이다.

     

    2. 링 버스 아키텍처로 데이터의 처리 효율성을 높이다

    샌디 브릿지 프로세서가 원 칩 패키지 형태를 갖추면서, 내부적인 아키텍처 구성도 바뀌었다. CPU 코어와 L3 캐시, 그래픽 코어와 기본적인 시스템 제어부를 통틀어 그룹 구성을 하고 있는데, 샌디 브릿지 프로세서에서는 이를 링 버스 아키텍처라 규정했다.

    여기서 L3 캐시는 LLC(Last Level Cache)라는 이름으로 바뀌어 불리게 된다. 특징적인 것은 모든 CPU 코어가 공유했던 기존의 LLC가 각각의 CPU 코어마다 분배된다는 점이다. LLC가 코어 별로 구성되면, 원하는 데이터에 접근하는 시간이 짧아지고, 대역폭이 늘어나 많은 양의 데이터를 처리할 수 있게 된다.

    우선, 위 방식의 아키텍처로 단축된 지연 시간은 9ms 수준이다. 네할렘 아키텍처가 쓰인 기존의 프로세서에서는 평균적으로 35~40ms이지만, 샌디 브릿지 프로세서의 링 버스 아키텍처에서는 평균 26~31ms로 데이터 처리에 걸리는 시간을 효과적으로 줄였다. 그래픽 코어에 전달되는 데이터도 일반 메모리를 건너뛰고 LLC로 바로 접근하기 때문에 처리 속도가 빨라지는 이점이 생긴다.

    샌디 브릿지 프로세서 지원하는 LLC 한 개의 대역폭은 초당 96GB 수준으로, 기존 방식의 프로세서보다 약 두 배가 큰 수치다. 이렇게 되면, 네 개의 CPU 코어를 갖춘 샌디 브릿지 프로세서의 경우, 최대 384GB/s 규모의 대역폭을 쓸 수 있다는 얘기가 된다. 링 버스 아키텍처로 구성된 각 부분은 모듈러 구조를 기반으로 하고 있어, 원하는 부분을 빼고 넣는 칩 설계상으로도 유리한 장점을 가진다.

    3.처리 구조 개선으로 강화된 CPU 성능

    3. 프로세싱 단계의 보강, 유닛 수 확장으로 이룬 처리 성능 향상

    샌디 브릿지 프로세서에 사용된 CPU 코에에서도 구조적인 개선이 이뤄졌다. 명령어 페치 유닛에 데이터가 위치한 주소와 정보를 전달하는 Branch Prediction Unit 내에서 1.5K 상당의 디코드 마이크로op 캐시가 추가된 것이다. 기존에는 Branch Prediction Unit을 통해 L1 캐시 메모리에서 데이터의 주소를 찾고 주소 버퍼에서 찾은 데이터의 위치를 추적해 읽어들였다.

    샌디 브릿지의 CPU 코어는 이러한 명령 프로세싱 단계를 간소화했다. 디코드된 마이크로op 캐시에서 처리할 데이터의 위치를 찾고, Branch Prediction Unit에서 데이터가 위치한 주소를 저장하면서 해당 데이터를 바로 읽어 들일 수 있게 되었다는 것이다.

    네할렘 아키텍처가 적용된 기존의 프로세서도 명령어 로드를 위한 마이크로 퓨전과 매크로 퓨전을 지원하는 Branch Prediction Unit을 넣었지만, 샌디 브릿지 프로세서에서는 여기에다 디코드 마이크로op 캐시를 사용해 명령어들을 좀 더 효율적으로 처리할 수 있게 됐다. 이 때, 마이크로op 캐시에 로드되는 명령어들은 클럭당 32Byte 단위로 읽어들여, 애플리케이션의 실행 효율을 기존보다 최대 80%까지 높였다.

    지연 시간도 낮아지고, 명령어 처리를 위한 높은 대역폭을 확보함으로써, 샌디 브릿지 프로세서의 CPU는 클럭 당 여덟 개의 명령어를 처리할 수 있는 구조로 탈바꿈했다. 이는 기존 구조의 프로세서에서 처리하는 명령의 단위보다 두 배가 더 많다.

    또한, 샌디 브릿지 프로세서의 CPU는 OOO(Out-of-Order)형 클러스터 구조를 갖추고 있다. 즉, 중앙에서 처리 되어야 할 레지스터 파일을 명령에 의지하지 않고도 물리적으로 처리 가능한 레지스터 파일로 저장하도록 한 것이다. 스케줄러 내에서 정수형 벡터와 소수점 벡터, 정수형 벡터 레지스터 파일로 분류해 저장함으로써, 버퍼의 공간을 확보했다. 메모리 클러스터는 데이터의 통로인 파이프라인을 확충하는 방식으로, 데이터의 읽기와 쓰기 대역폭을 향상시켰다.

     

    4. 기존 메인보드와 호환되지 않는 CPU 소켓, 대체 왜?

    ▲ 좌측이 샌디 브릿지(LGA 1155), 우측이 기존의 린필드(LGA 1156) 프로세서다.

    이번 특징은 샌디 브릿지 프로세서에서 사용자들이 가장 궁금해 하는 특징이 될 것으로 보인다. 네할렘 아키텍처를 사용한 린필드와 클락데일 프로세서는 LGA 1156 소켓을 썼지만, 샌디 브릿지 프로세서는 소켓이 하나 줄어든 LGA 1155 소켓을 쓰게 된다. 불과 2년 남짓한 기간에 CPU 소켓을 바꾼 것인데, 샌디 브릿지 프로세서에서 LGA 1155 소켓을 채택하게 된 이유는 무엇일까?

    위의 샌디 브릿지와 클락데일 프로세서의 아키텍처가 그려진 모식도를 보면, 기능적인 차이를 엿볼 수 있다. 클락데일 프로세서는 QPI(Quick Path Interconnect) 시스템 버스를 사용하고 있지만, 샌디 브릿지 프로세서는 QPI 대신, 린필드 프로세서처럼 DMI 기반의 시스템 버스를 이용한다. 그러나 소켓 규격을 달리한 가장 큰 이유는 따로 있다.

    시스템 버스의 베이스 클럭(BCLK)이 100MHz로 낮게 설정됐다는 점이다. 여태 선보인 인텔의 프로세서들은 133MHz를 정규 클럭으로 매겼으나, 샌디 브릿지 프로세서를 기점으로 베이스 클럭을 수정한 것이다. 대신, CPU 배수 단위를 높여 최종 클럭 수를 맞추게 했다. 더욱이, PCI-E 장치와 SATA 장치를 비롯한 주변 장치의 클럭을 분배하는 제네레이터도 베이스 클럭와 연동된다.

    지난 세대의 프로세서까지는 클럭 제네레이터와 베이스 클럭이 별도로 다뤄졌지만, 샌디 브릿지에서는 클럭이 바뀜에 따라 주변 장치의 클럭이 함게 오른다. 그래서 샌디 브릿지 프로세서의 오버 클럭을 한다면, 베이스 클럭을 조절하는 것보다 배수 단위를 높이는 것으로 시도하는 것이 바람직하다.

    그런데, 소켓 하나만 빠진 프로세서라면 기존 메인보드에서도 사용할 수 있지 않을까? 이 물음의 답은 프로세서 뒷면의 금속 접점과 안쪽으로 움푹 패인 위치를 보면 알 수 있다. 처음부터 움푹 패인 위치까지 기존의 프로세서는 여덟 줄, 샌디 브릿지 프로세서는 여섯 줄이다.

    이는 두 프로세서의 모양이 서로 같지 않아 샌디 브릿지는 기존에 사용하던 메인보드에서도 장착되지 않는다는 것을 뜻한다. 그래서 샌디 브릿지 프로세서를 사용하려면, LGA 1155 소켓이 준비된 인텔 6시리즈 메인보드를 구매해야 한다.

    4.테스트 시스템 셋팅 및 소개

    샌디 브릿지 프로세서의 기본 성능을 파악하기 앞서, 테스트를 위한 시스템을 준비했다. 오픈 케이스를 바탕으로, 아수스의 P67 메인보드, 쿨러마스터의 CPU 쿨러와 파워 서플라이가 사용됐다. 그리고 비교 대상인 P55 메인보드와 린필드 시스템의 구성도 동일하게 갖춰, 외부 조건에 의한 프로세서의 성능 변화를 줄였다.

     

    우선, 테스트 시스템에 공통으로 사용된 CPU 쿨러부터 살펴보자. 쿨러마스터가 출시한 V6 GT는 일반적인 타워형 쿨러보다 부피가 더 크다. 듀얼 볼 베어링을 사용한 120mm 팬 쿨러를 히트싱크의 좌우에 하나씩 달아 프로세서의 냉각 성능을 높인 것이 특징이다. 쿨러가 양쪽에 장착된 채로 패키징되어 있고 설치된 팬 쿨러의 분리가 간편해, V6 GT는 비교적 손쉽게 장착된다.

    히트파이프는 V자형으로 둘러 좌우에 여섯 개씩 배치해, 프로세서의 열 전도율을 높였다. 프로세서와 맞닿은 베이스와 바깥에 노출되는 히트파이프는 니켈 도금으로 처리해 부식을 막고 비대칭 구조를 이루는 알루미늄 히트싱크로 프로세서에서 발생되는 열을 효과적으로 잡는다. 두 개의 팬 쿨러를 사용했지만, 소음은 18~38dB 수준으로 낮은 편에 속한다. 플랫폼을 가리지 않고 장착된다는 것이 장점이나, 일반적인 구조의 사제 쿨러보다 설치 과정이 길다.

    쿨러마스터의 사일런트 골드 시리즈는 이름 그대로 80Plus 골드 인증을 만족하는 고급스런 파워 서플라이다. 모듈러 타입의 전원 케이블을 적용해 시스템 내부의 공간을 확보하기 용이하며, 휘거나 꺽어 사용하기 쉬운 연질 케이블을 다량으로 제공해 선 정리가 쉽다. 파워 서플라이 내부에는 두 개의 액티브 PFC 회로와 EMI 필터 등 기본적인 회로와 과전류와 과전압을 막는 보호 회로가 구성돼 있다.

    내장된 정류 캐패시터는 450V의 내압을 지닌 루비콘 캐패시터 두 개를 달아, 안정적인 출력을 낼 수 있도록 했다. 이는 일반 규격의 파워 서플라이보다 내압이 두 배 이상 높은 수치다. 테스트 시스템에 사용된 사일런트 골드는 정격 출력이 1,000W에 달해, 고성능을 가진 그래픽카드를 다중으로 연결해서 쓸 때 최적의 성능을 낸다. 이 때, 파워 서플라이는 알루미늄 재질의 히트싱크와 135mm의 저소음 쿨링팬으로 냉각돼, 소음과 발열 수준이 낮은 편이다.

    아수스의 P8P67 디럭스는 디지털 전원부를 앞세운 Digi+ VRM이 특징이다. 일반적인 구조의 전원부보다 동작 범위를 세세하게 설정해 줄 수 있어, 전문적인 오버 클럭이 가능하다. CPU 전원부외에 다른 동작부의 전원부도 지난 P55 메인보드보다 한 차례 강화돼, 여유로운 오버 클럭을 시도할 수 있는 제품이다. 그 외에 절전 솔루션인 EPU, CPU 성능을 높이는 TPU를 딥 스위치로 동작 여부를 간편하게 조작할 수 있어, 시스템의 성능을 효율적으로 조절할 수 있다.

    테스트 시스템 환경 설정

    CPU

      인텔 코어 i7 샌디 브릿지 2600 프로세서 (@ 2.8GHz)
      인텔 코어 i7 린필드 875K 프로세서 (@ 2.8GHz)

    메모리

      커세어 DDR3 PC3-12800 1GB @ 1,333MHz X 3EA

    메인보드

      아수스 P8P67 디럭스

    그래픽카드

      AMD 라데온 HD 6850 1GB

    하드디스크

      WD SATA2 WD6400AAKS

    광학디스크

      벤큐 블루레이 콤보 BW-1000

    파워

      쿨러마스터 사일런트 골드 1,000W

    운영체제

      윈도우 7 64비트 얼티밋 K (서비스 팩1 RC 적용)

    그래픽 드라이버

      ATI 카탈리스트 10.12

    하지만, CPU 벤치마크 성능에 변수가 될 수 있는 요소인 동작 클럭은 두 프로세서 모두 2.8GHz로 맞췄다. 같은 숫자의 동작 클럭으로 정한 것은 아키텍처의 변화에 따른 CPU의 성능을 알기 위함이다. 샌디 브릿지와 린필드 프로세서의 시스템 버스 클럭은 100MHz와 133MHz로 각각 다르지만, 두 클럭의 최소 공배수에 가까운 400MHz를 단위로 계산해 클럭을 맞추면, 거의 같은 동작 속도로 맞춰줄 수 있다.

    그래서 테스트 할 코어 i7 2600 프로세서는 100MHz의 시스템 버스 속도에 34배수를 곱한 3.4GHz로 동작하지만, CPU 배수를 28배수로 낮춰 2.8GHz로 동작하게 했다. 린필드 프로세서인 코어 i7 875K도 마찬가지로 133MHz에 22배수를 곱해 2.93GHz로 동작하지만, 배수를 한 단계 낮춰 2.8GHz로 동작하게 했다.

    5.샌디 브릿지의 기본 성능은 어떨까?

    1. PC마크 밴티지

    샌디 브릿지와 린필드 프로세서의 기본 성능을 파악하기 위한 벤치마크는 PC마크 밴티지가 제격이다. 멀티미디어와 게임, 인터넷 등 거의 모든 분야의 활용 패턴을 다룬다. PC마크 밴티지에서 살핀 두 프로세서의 성능은 어떨까?

    동클럭에서 비교한 두 프로세서의 시스템 성능은 평균 10% 안팎의 차이를 보인다. 물론, 두 프로세서 가운데 성능이 빠른 것은 샌디 브릿지다. 게임과 멀티미디어 분야의 성능은 린필드 대비 소폭 상승한 데 비해, 인터넷을 포함한 커뮤니케이션 영역에서는 50% 이상 개선된 성능을 나타냈다. 샌디 브릿지에서 커뮤니케이션에서 강한 성능을 낸 요인은 한 가지로 압축할 수 있다.

    우선, 인터넷은 어느 환경보다 보안 어플리케이션이 활성화돼 있다. 그래서 PC마크 밴티지의 커뮤니케이션 영역은 인터넷 보안 성능을 중점적으로 다루는데, 결과적으로 이 분야에서 샌디 브릿지가 더욱 빠른 성능을 냈다는 것을 의미한다.

    인터넷 보안 다음으로 확인하는 성능은 웹 브라우저를 얼마나 빨리 띄울 수 있는지, 여러 개의 웹 브라우저 창을 띄울 때 걸리는 시간을 얼마나 줄일 수 있는 지에 대한 테스트다. 그러나 이 테스트는 커뮤니케이션에서 비중 있게 다루는 부분은 아니다.

    어차피 해당 프로세서의 처리 구조는 4코어 8쓰레드로 이루어져, 웹 브라우저를 띄우는 것 자체의 성능은 의미하는 바가 작으니 말이다. 그 밖에 확인한 하드디스크의 성능, 문서 작성, 웹 페이지 편집 등의 생산성 부문은 린필드 프로세서를 장착한 시스템과 성능에서 차이가 없는 것으로 나타났다.

    그러나 샌디 브릿지 프로세서를 쓰는 인텔 6시리즈 메인보드에서는 SATA3 인터페이스를 네이티브로 지원하고, 린필드 프로세서를 위한 인텔 5시리즈 메인보드에서는 외부의 컨트롤러 칩셋으로 SATA3 인터페이스를 지원한다. 만약, 하드디스크 대신 SSD를 쓰는 사용자라면, 생산성 부문에서

     

    2. 씨네벤치 R11.5, 3D 마크 11

    씨네벤치 R11.5로 테스트한 프로세서의 이미지 렌더링 성능은 샌디 브릿지가 린필드보다 14~20%가 빠른 것으로 나타났다. CPU를 기반한 이미지 렌더링은 그래픽카드와 마찬가지로 정수와 벡터 연산을 모두 수행하기 때문에 프로세서의 성능을 판단하는 또다른 기준이 된다.

    이 기준으로 판단해 볼 때, 샌디 브릿지의 연산 효율은 린필드보다 좋다고 풀이할 수 있다. 그런데, CPU의 싱글 코어 대비 멀티 코어 성능 효율은 린필드가 오히려 더 우수한 것으로 나왔다. 샌디 브릿지가 4.84배, 린필드는 5.09배 수준이라는 것이다. 하지만, 샌디 브릿지는 이미 CPU의 싱글 코어 성능에서 린필드보다 20%를 앞서 있기에, 절대값으로 비교한 멀티 코어 성능도 린필드를 앞선다.

    번외적으로 알아본 3D 마크 11의 CPU 물리 연산 성능도 샌디 브릿지가 우수하다는 점을 반증하고 있다. 3D 마크 11에서 하는 물리 연산이란, 객체의 움직임을 사실적으로 묘사하기 위한 연산과 한 번에 연산할 수 있는 객체의 수를 늘려, 높은 품질의 그래픽을 얻을 수 있도록 하는 것이다. 이 부분에서 샌디 브릿지는 린필드보다 약 12% 빠른 성능을 냈다.

    6.멀티미디어 분야에 최적화 시도한 AVX

    샌디 브릿지 프로세서에서 AVX는 최근의 멀티미디어 분야에서 강조하고 있는 명령어다. 멀티미디어 분야 가운데서도 벡터(Vector) 연산을 주축으로 하는 이미지 편집과 동영상 트랜스코딩, 오디오 인코딩 등 전문적인 프로그램을 사용해 작업을 하거나, 3D 모델링을 통한 시각적인 지표 분석 등 산업용 분야에서의 명령어 활용이 점차 기대되고 있다.

    그런데 샌디 브릿지에서 새로 추가된 AVX 명령어는 무엇을 의미하는 것일까? AVX를 이해하기 위해선 기존의 네할렘 세대까지 지원하던 SSE 명령어에 대한 이해가 필요하다. 샌디 브릿지의 AVX는 SSE의 개념이 확장된 명령어 체계이기 때문이다.

    SSE는 Supplemental Streaming SIMD Extension의 준말로, SIMD가 한 번에 여러 개의 명령어를 처리할 수 있도록 준비한 명령어들의 모임이다. 여기서 SIMD(Single Instruction Multiple Data)는 풀이한 이름 그대로, 하나의 명령을 실행하는 것으로 많은 데이터 값을 얻는 것을 말한다. 이를 SSE라는 SIMD 명령어 셋트를 프로세서 내에 포함시켜, 그래픽 처리와 연관된 멀티미디어 작업의 능률을 개선해 왔던 것이다.

    그러던 중, 샌디 브릿지 프로세서부터는 SSE4.2의 그 다음 버전인 SSE5가 아니라, AVX라는 새로운 이름의 명령어 셋트를 지원하기 시작했다. 이름이 바뀐 이유는 경쟁사인 AMD가 먼저 SSE5 명령어 지원을 발표해, 인텔이 이를 기반한 AVX 명령어를 만들어 지원토록 했다는 데 있다. 그렇지만 샌디 브릿지의 AVX 명령어 지원으로 향상된 성능은 기존 프로세서의 SSE보다 평균 75% 이상이라 밝혔다.

    AVX 명령어가 기존의 SSE와는 무엇이 다르기에 75% 규모의 성능 향상을 이룬 것일까? 원인은 간단하다. 앞서 AVX(Advanced Vector Extensions)는 SSE에서 확장된 개념의 명령어라 소개했다. 말 그대로 SSE의 명령어 처리 구조를 개선한 것이다. 여태 선보인 SSE는 128비트를 단위로 벡터 명령어를 처리했지만, AVX는 두 배 커진 256비트의 단위로 같은 명령어를 처리한다는 것이다.

    이렇게 되면, 1초당 처리되는 벡터 명령어를 기존보다 더 많은 규모로 처리할 수 있는 장점이 생긴다. 처리할 수 있는 명령어의 단위가 커지면, 벡터 명령어를 로드하는 포트 수도 늘어나야 한다. 샌디 브릿지 프로세서는 이에 대비해 두 개의 128비트 로드(Load) 포트를 내장하도록 했다.

      

    ▲ AVX 명령어를 통해 반복해서 쓰는 명령어의 숫자를 줄인다.

    그리고 명령어 처리 후에 얻은 데이터 값을 다시 정렬하는 시간을 단축시켜, 원하는 데이터 값을 빠르게 접근할 수 있도록 했고, 3과 4의 피연산 함수를 통해 벡터값과 스칼라 코드를 사용하기 위한 레지스터를 효율적으로 운영할 수 있게 했다. 또한, 이전 프로세서에서 지원하지 않았던 정렬되지 않은 물리 메모리의 접근, 새로운 실행 코드를 지원해 프로세서의 부하량을 줄였다.

    특히, AVX는 벡터값의 연산 성능과 효율을 강화시킨 것 외에, 최근 웹에서 부각되고 있는 HTML5 환경, 플래시 미디어를 지원토록 해 상당한 영향을 떨칠 것으로 전망하고 있다. 그래픽카드의 GPU칩보다 제조 가격이 저렴하면서 소비 전력도 낮아 GPU 기반으로 자리잡은 벡터 연산 환경에 파장을 일으킬 것으로 주목되고 있다.

    그렇다면, 이를 지원하는 샌디 브릿지 프로세서의 성능은 어떨까? 같은 속도로 동작하는 린필드 프로세서와 비교한 결과, 벡터 연산에 해당되는 소수 연산과 부동 소수점 연산 성능이 두 배 이상 빠른 것으로 나왔다. 이는 AVX를 지원하지 않는 린필드가 소수 연산과 부동 소수점 연산을 iSSE2 명령어 셋트에 기반해 처리되고, 한계 대역폭이 샌디 브릿지의 2분의 1수준이라는 점에서 비롯된 결과다.

    물론, AVX 명령어를 사용하기 위해선 어플리케이션을 제작하고 분석하는 컴파일러 환경에서 먼저 지원해야 한다. 마이크로소프트의 비주얼 베이직 2010 버전에서 사용하는 MASM(Microsoft Macro Assembler), 인텔의 x86 아키텍처 프로그래밍을 위한 NASM(Netwide Assembler) 등의 고급 언어를 사용하는 환경에서는 이미 AVX 명령어가 지원되고 있으나, 우리가 쓰는 시스템 환경과는 거리가 멀다.

    하지만, 이 AVX 명령어를 운영 체제 차원에서 지원하기 시작했다. 리눅스의 커널(Kernel) 설계에 활용되던 것을 최근엔 윈도우 운영 체제로 활용 폭을 점차 넓혀가고 있다. 결과값 추출에 적용된 윈도우 7 서비스 팩 1과 윈도우 서버 2008 R2 서비스 팩 1 환경에서 AVX 명령어를 지원하도록 했다.

    이는 어플리케이션의 입장에서 볼 때, AVX 명령어의 본격적인 활용 기반이 마련됐다고 볼 수 있는 내용이다. 이런 의미에서 바라본 샌디 브릿지 프로세서는 AVX 명령어를 기반한 어플리케이션에서 최적의 성능을 발휘할 수 있다는 점을 예상할 수 있다.

    7.기존 코어 시리즈보다 개선된 AES-NI

    암호의 복호화 과정에 쓰이는 AES는 샌디 브릿지 프로세서에 새롭게 추가된 것은 아니다. 이미 웨스트메어 세대의 프로세서인 걸프타운과 클락데일부터 AES-NI(New Instruction)라는 이름의 명령어 셋트로 AES를 지원했으니 말이다. 하지만, AES-NI는 단순히 시장의 위치로 보면, 각각 최상급 프로세서와 중보급형 프로세서에서만 누릴 수 있는 혜택일 뿐이었다.

    두 영역의 사이를 메우고 있는 중고급형 프로세서인 블룸필드와 린필드는 AES-NI 명령어가 없었기 때문에, AES를 지원하지 못했다. 그러나 샌디 브릿지 프로세서는 라인업에 관계없이 모두 AES-NI 명령어를 지원하고 있어 AES를 쓰는 데 제한이 없다. 그런데, 모든 샌디 브릿지 프로세서에 AES를 지원하게 된 계기는 무엇일까?

    AES를 지원하지 않는 기존의 중고급형 프로세서를 대체하기 위한 수단일 수 있지만, 결정적으로는 AES를 사용할 수 있는 범위가 지속적으로 확장되고 있다는 데서 찾을 수 있다. 본래 AES는 보안 영역에 사용되는 알고리즘 가운데 하나로, 중요한 파일이나 네트워크에 암호를 걸어 보호할 때 쓰인다.

    요즘 무선 랜과 인터넷 공유기, 스마트폰의 Wi-Fi 핫스폿 기능에서 보안용 비밀번호를 정할 때 128비트 기반, 256비트 기반 암호화 기술을 적용하는데, 이 암호화 기술은 AES에서 파생된 것이다. 표준 규격으로 쓰던 ASK, PSK 등의 기본 알고리즘을 한 단계 강화한 것으로, 보안에 대한 신뢰성에서 비교적 높은 평가를 받고 있다.

    인터넷 상에서 일반화 된 AES가 이제는 윈도우나 리눅스 등의 운영체제 내에서 사용할 수 있는 어플리케이션 영역으로 확대되고 있다. 공동으로 쓰는 하드디스크의 파티션 전체에 보안을 걸거나, 오픈 소스 기반으로 작성된 객체들을 보호한다. 최근에는 7-Zip을 비롯한 파일 압축 프로그램에도 AES가 적용되고 있다.

    비밀번호로 보호된 압축 파일의 압축을 해제할 때, AES가 암호의 복호화를 도와 압축 해제에 걸리는 시간을 단축시켜 줄 수 있다는 것이다. 이를 지원하는 샌디 브릿지 프로세서는 기존보다 두 배 이상 줄여준다. 또다른 압축 프로그램인 윈집(Winzip)은 AES 지원이 아직 공식화 되지 않았지만, 비밀번호로 보호된 압축 파일의 압축 해제에 효과가 있는 것으로 나타나고 있다.

    이처럼, AES의 활용 범위는 우리가 실생활에서 쓰는 영역으로 확장되고 있는 추세다. 이런 추세대로라면, 네트워크 상에서 제한적으로 사용했던 AES의 활용 비중도 높아질 것으로 보인다. 샌디 브릿지 프로세서는 AES를 쓰기 위한 명령어를 기본으로 지원하고 있으니, 추후 등장할 어플리케이션에서 좋은 성능을 나타낼 것으로 기대되고 있다.

    그럼, 샌디 브릿지에서 AES를 이용한 성능은 어떨까? 먼저, 산드라로 살핀 AES-256비트 기반의 암호화 성능을 살펴보자. 비교군으로 테스트한 린필드는 AES-NI 명령어가 탑재되어 있지 않아, 하위 명령어 셋트를 사용해 암호화 성능을 출력했다. 결과값을 서로 비교하면, 샌디 브릿지가 린필드보다 일곱 배 이상 빠르다는 사실을 알 수 있다.

    샌디 브릿지는 앞서 소개한 것처럼, AES를 위한 AES-NI 명령어가 탑재돼 있기 때문에 암호화 성능에서 상당히 앞선다. 그리고 산드라로 확인한 이론적 차이는 7-Zip과 윈집을 비롯한 압축 프로그램에도 영향력을 끼친다. 린필드에서 70초 대가 걸리던 윈집의 보호 압축 성능이 샌디 브릿지는 50초 대로, 비밀번호를 넣어 압축을 해제하는 성능도 40초 초반에서 20초 중반으로 단축시킨다.

    7-Zip은 윈집에서 보여 준 시간 차 보다는 영향이 적지만, 3~4초 범위로 작업 시간을 줄였다. 이는 운영 체제를 재부팅하고 처음 확인한 결과라 차이가 적다. 같은 패턴으로 두 번째 작업에 들어서면 린필드보다 두 배 빠른 보호 압축 성능을 낸다.

    8.아키텍처의 개선이 돋보인 샌디 브릿지

    이처럼, 인텔이 출시한 샌디 브릿지 프로세서는 기존의 프로세서가 가진 장점과 이후에 등장한 프로세서의 특징을 결합해, 성능과 효율의 두 마리 토끼를 모두 잡았다. 이는 같은 클럭에서 테스트한 샌디 브릿지와 린필드 프로세서의 결과값을 보면 알 수 있는 내용이다.

    이미 동클럭에서 기존 프로세서 대비 10% 이상의 성능 차를 냈는데, 이는 실제 출시된 프로세서에서 30% 이상의 성능을 가질 수 있다는 것을 의미한다. 샌디 브릿지 프로세서는 아키텍처 구조를 개선시키면서 CPU 클럭을 높인 제품이기에, 기존에 사용던 시스템보다 확실히 빠른 성능을 누릴 수 있다는 것이다.

    링 버스 아키텍처를 기반한 설계로 시스템의 기본 성능과 효율을 강화한 것은 물론, 기존의 프로세서가 선보이지 못했던 기능으로 어플리케이션의 활용 폭을 넓힌 점도 샌디 브릿지에서 주목할 만한 특징이다. 린필드가 오직 성능을 위한 프로세서로 군림했다면, 샌디 브릿지는 높은 성능과 실생활에 맞는 어플리케이션에 최적화된 프로세서다. 이는 기존 라인업에 존재하던 클락데일과 걸프타운 프로세서의 완충 장치로서 제 역할을 해낼 수 있다는 뜻이기도 하다.

    대표로 엿볼 수 있는 샌디 브릿지의 기능은 AVX와 AES-NI 명령어다. 두 명령어는 흔히 말하는 전문적인 영역에서 활용돼 왔다. 하지만, AVX는 어플리케이션의 확장으로 이룰 수 있는 성능 개선의 가능성을 낙관적으로 평가했고, AES-NI는 인터넷과 시스템 보안에만 한정되던 영역을 파일 보호 압축 등 우리가 혜택을 볼 수 있는 범위로 확장시켰다.

    그리고 본문에서는 다루지 않았지만, 샌디 브릿지 프로세서는 HD 2000 / 3000 그래픽 코어가 내장된다고 했다. 내장 그래픽 출력을 할 수 있는 H67 메인보드를 사용할 경우, 퀵 싱크 비디오라는 기술로 고화질의 동영상을 더욱 빠른 시간 안에 인코딩 할 수 있다. 공통적으로는 2세대로 진화한 터보 부스트로 프로세서가 사용하는 전력과 성능을 더욱 효율적으로 운영할 수 있게 해, 작업 환경을 개선하는 데 상당한 도움이 될 것으로 기대되고 있다.

    다만, 오버 클럭은 샌디 브릿지 프로세서의 아킬레스 건이 될 듯하다. 시스템 버스의 클럭을 높이는 기존의 오버 클럭 방식에서 벗어나 있기 때문이다. 시스템 버스의 클럭이 주변 장치의 클럭과 맞물려, 일반적인 오버 클럭 방법을 사용하기 어렵다. 대신, CPU의 배수 제한을 없앤 K프로세서를 일반화시켜, 기존보다 더 쉬운 오버 클럭 방법을 제안했다.

    이는 오버 클럭으로 성능 향상을 노리는 사용자와 순정 그대로 쓰는 것을 선호하는 사용자에 대한 배려가 아닐까? 어쨌든 샌디 브릿지 프로세서가 가진 성능과 각 기능의 장점을 종합적으로 평가했을 때, 기존의 프로세서보다 매력적이라는 점은 부정할 수 없다. - 케이벤치(www.kbench.com)

    아수스코리아에서 케이벤치 회원님들을 위해 기사에 소개된 아수스P8P67 메인보드 제공해 주셨습니다. 케이벤치에서는 이를 회원 여러분께 경품으로 제공해드리고자 리플 이벤트를 진행합니다. 관심 있는 회원님들의 많은 참여 부탁 드립니다. 

    리플 이벤트 기간 : 2011년 1월 21일까지
    리플 이벤트 발표 : 2011년 1월 24일 (이벤트 페이지 참고)
    리플 이벤트 품목 : 아수스 P8P67(P67 메인보드)
    리플 이벤트 대상 : 1명 
    리플 이벤트 선정 : 추첨기를 이용한 무작위 선정

    * 리플 이벤트 신청시 회원님 주소 부분을 필히 확인하시고 
      상품 수령이 가능한 주소로 변경해 주시길 바랍니다.

    * 회원정보가 일치하지 않을 경우 경품 당첨이 취소됩니다.

    국내 최대 IT/디지털 미디어 케이벤치 www.kbench.com

    반응형

    댓글

Designed by Tistory.