듀얼코어 스냅드래곤 1.5Ghz. 정말 최강인가? What is IT?
2011.06.02 20:12 andu Edit
기존 싱글코어의 성능차
기존 싱글코어 ARM v7 Cortex-A8기반 프로세서의 성능 비는 다음과 같았다.
1Ghz 기준, 괄호 안은 대략적인 성능비. GPU를 제외한 Only CPU 성능 기준이다.
스냅드래곤(80) < 스냅드래곤 2세대(98) ≤ OMAP 36xx(98) ≤ 허밍버드(100)
스냅드래곤은 상당히 많은 제품에 들어가 있는데,
넥서스원을 비롯해 주로 HTC와 국내 스마트폰 제품에서 사용되었다.
스냅드레곤 2세대는 기존 1세대의 마이너업글판으로,
디자이어HD, 베가X/S등에서 사용된 제품이다.
OMAP은 2세대에 해당하는 3600시리즈가 드로이드X 및
국내에선 옵티머스 마하와 같은 제품에서 쓰였다.
그리고 허밍버드는 알다시피 갤럭시S 계열에서 사용되었으며,
CPU 코어만 치면 아이패드와 아이폰4에서도 사용되었다.
(아이폰4의 경우 850Mhz정도의 클럭으로 알려져 있다.)
성능은 스냅드래곤이 허밍버드의 80%정도,
스냅드래곤 2세대가 허밍버드에 근접한다고 알려져 있다.
Cortex-A8? Cortex-A9??
http://en.wikipedia.org/wiki/ARM_architecture
위키페디아에 ARM Cortex-A8과 Cortex-A9의 레퍼런스가 있는데,
A8의 경우 IO(인오더)아키텍처에 Only 싱글코어인 반면,
A9의 경우 OoO(아웃오브오더)아키텍처에 싱글~쿼드코어까지 가능한 디자인이다.
따라서 최근 등장하는 듀얼코어 제품은 Cortex-A9로, OoO 아키텍처를 가진다.
이에 해당하는게, 테그라2, A5, 엑시노스와 같은 제품들이다.
http://andu.nm3.kr/blog/4477
위 글에서 설명된 것 처럼 IO와 OoO는 성능차가 발생하는데,
IO를 쓰는 제품중 대표적인 것이 아톰이라는걸 생각하면 그 성능을 알 만 하다.
물론 Cortex-A9에 적용된 OoO는 프론트엔드에만 적용되어 완벽한 OoO는 아니지만,
성능차이는 꽤 있다고 볼 수 있겠다.
따라서 기존 싱글코어 ARM프로세서와 같은 1Ghz 듀얼코어 ARM프로세서의 경우,
코어 하나만 치더라도 기존 A8계열 프로세서보다 동클럭에서 성능이 더 높다.
다만, 듀얼코어의 경우 전력소모가 꽤 커지기에 전력관리를 위해 클럭 조절 폭이 더 크므로,
일반적인 상황에서 클럭 다운량을 싱글코어보다 많이 잡기 때문에,
실질적으로는 성능 특성에서 엇갈리는 면이 있다.
이는 이전 포스트(http://andu.nm3.kr/blog/4864)에서도 언급한 바가 있다.
듀얼코어 스냅드래곤은 코어2쿼드의 데자뷰......
이번에 탑재 제품이 츨시되는 듀얼코어 스냅드래곤은 Cortex-A9 아키텍쳐가 아니다.
위에서 언급한 ARM의 Cortex-A8 레퍼런스에 듀얼코어는 없으므로,
당연히 Cortex-A9일것으로 생각하고 있었으나,
알려진바에 의하면 Cortex-A9가 아닌 기존 스냅드래곤을 듀얼코어로 만든것이라고 한다.
실질적으로 퀄컴 스냅드래곤의 스콜피온 아키텍처는 A8 기반은 아니고, A8 유사 아키텍처다.
허밍버드와의 비교에서도 성능차이가 발생하는 부분은 그런 점에서 발생한다고 볼 수 있겠다.
덕분에 다른 A8계열 프로세서보다 빠르게 1Ghz 제품을 출시했다는 장점이 있었다.
여튼, 현재 나온 듀얼코어 스냅드래곤이 A9기반이 아니라면,
싱글코어 성능은 기존 스냅드래곤 2세대와 동일할 것으로 보여진다.
출시 시기를 고려할 때, 듀얼코어 적용 외에 추가적인 성능향상까지 꾀했다고 보기엔 어려움이 있다.
그럼 성능이 상대적으로 떨어지는 기존 아키텍처로 왜 듀얼코어를 만들었는지. 이는 클럭에서 알 수 있다.
현재 A8계열 CPU의 오버클럭이 2Ghz전후까지 가능한걸로 알려져 있는 것과,
이 듀얼코어 스냅드래곤의 클럭이 1.5Ghz로 출시되고 있다는 점,
OoO인 A9보다 클럭을 올리기가 쉽다는 특징들을 생각해 보면 답이 나온다.
이는 기존 스냅드래곤처럼 실질적인 성능보다 클럭 과시를 중시했다고 볼 수 있겠다.
마치 펜티엄3~4 시절을 보는 듯 하다.
클럭 = 성능이라는 공식은 같은 아키텍처일 경우 실제로 성립하는 부분인데,
현재로써 A8 대비 A9 성능이 펜티엄4와 코어2 시리즈만큼 차이나는 것은 아니기 때문에,
역시 숫자마케팅이 유효하다는 점이 있다. 실질적으로 듀얼코어 스냅드래곤을 채용한 제품들은,
1.5Ghz라는 클럭빨로 최고성능임을 과시하는 마케팅 펴고 있다.
듀얼코어 스냅드래곤이 기존 스콜피온과 동일한 아키텍처임에도
나온 시기가 다른 A9 듀얼코어 제품보다 늦게 나온것은
Cortex-A8 이나 스콜피온이나 듀얼코어를 고려한 아키텍처는 아니기 때문에,
아키텍처 수정에 시간이 걸린것으로 보인다.
코어2쿼드가 될것인가 펜티엄D가 될것인가....
듀얼코어 스냅드래곤은 코어2쿼드가 코어2듀오를 두개 올린것 처럼,
듀얼코어 스냅드래곤도 기존 스콜피온 코어 2개를 1개 다이로 통합한 것인데,
기본적으로 듀얼코어가 고려된 아키텍처가 아닌 만큼
듀얼코어의 연계성능이 어떨지 불확실하다.
코어2쿼드의 경우에는 의외로 코어 연계성능이 그리 나쁘지 않았으나,
펜티엄4를 2개올린 펜티엄D 때의 경우 연계성능이 매우 좋지 않았던 점을 생각하면,
듀얼코어 스냅드래곤이라는 이 커스텀 아키텍처가 어떤 연계성능을 보일지는
상당한 관건이라고 하겠다.
멀티코어 연계성능이라는 것은, 겹치는 데이터를 가지고 각자 다른 연산을 하는
멀티스레드 프로그램 특성상, 2개 코어가 서로 데이터를 공유하는데 걸리는 제약이
얼마나 해소되어있는가를 말하는데, 이 성능이 떨어지는 경우,
단순 싱글스레드 프로그램은 별 영향이 없지만, 멀티스레드 프로그램에서는
1개 코어 대비 200%인 2개 코어 최대 성능을 다 활용하지 못하는 상황이 발생한다.
따라서 이런 점은, 현재 스마트폰 애플리케이션 중에서
멀티코어 지원 어플이 적은 현재는 그리 큰 영향을 받지 않지만,
이후 멀티코어 지원 애플리케이션이 증가한 후에는 상당한 영향을 받게 된다.
듀얼코어 스냅드래곤의 성능 우려 사항들.
위에서 언급한 사항들은 전부 듀얼코어 스냅드래곤의 성능 우려사항이 된다.
일단 먼저 기존 스냅드래곤 2세대가 허밍보다는 미묘하게 성능이 부족하다는 점.
일단 아키텍처 차이가 있기에 성능특성이 엇갈리는 부분이 있을것으로 보여지지만,
지금까지의 평가로는 허밍버드와 동급으로 보면서도 조금 약하다는 인식이다.
뭐, 여기까지는 오차범위로 넘어갈 수 있다.
두번째는 듀얼코어임에도 Cortex-A9가 아니라는 점이다.
Cortex-A8의 성능은 대략 A9의 80%정도의 성능으로 보고있다.
따라서 듀얼코어 스냅드래곤이 1.5Ghz나 되더라도
80%적용해서 1.2Ghz. 즉, 1.2Ghz 엑시노스와 동급으로 볼 수 있겠다.
따라서 실제 성능은 나와봐야 알겠지만, 듀얼코어 스냅드래곤 1.5Ghz를 채용한 제품은
기존 1.2Ghz 엑시노스가 채용된 갤럭시S2와 동급이 될 것이라는 얘기다.
세번째는 듀얼코어의 연계성능이다.
퀄컴의 듀얼코어 스냅드래곤은 스콜피온의 2코어 버전으로,
원래부터 멀티코어를 염두한 Cortex-A9 아키텍처와 달리
연계성능이 그리 좋지않을 가능성이 높다.
엑시노스와 테그라2.
모토로라 아트릭스의 테그라2 1Ghz MANDRO Bench 결과.

갤럭시S2의 엑시노스 1.2Ghz MANDRO Bench 결과. 출처: http://yurion.net/2075
위는 아트릭스와 갤럭시S2의 벤치마크 결과이다.
점수 비율을 계산하면 딱 200Mhz만큼의 성능차이가 나오는 것으로 보아,
이전 A8계열 CPU들과 달리 A9계열에서는 제조사에 따른 성능차이는 없다고 볼 수 있다.
여기서 주목할 것은 가온데 윗쪽의 퍼센트치 인데,
이는 싱글 스레드와 듀얼 스레드 작업을 각각 실행해서 추가 성능 향상 비율을 낸 것이다.
즉, 위에서 언급한 듀얼코어 효율을 확인할 수 있는 부분이다.
(멀티코어 효율은 작업에 따라, 프로그램을 만들기에 따라 차이가 나기 때문에,
실질적으로 저 수치는 최대값, 실사용 프로그램에서는 그 이하의 효율이 된다.)
그 효율이 테그라2는 약 92%, 엑시노스는 거의 100%에 달한다.
이는 출시 시기를 생각하면 납득 할 만한 차이라고 하겠다.
그리고 그 비율만큼 벤치 수치에도 적용되어있다.
스콜피온과 Cortex-A9의 비교로 예측하는 듀얼코어 스냅드래곤의 성능.
그래서 이번에 나올 듀얼코어 스냅드래곤의 성능을 짐작해 보기 위해
스냅드래곤 1세대인 넥서스원과, 2세대인 디자이어HD에서 같은 벤치를 돌려보았다.
위의 두 벤치 결과가 폰 구입후 얼마 되지 않아 한 테스트인 반면,
지금 테스트항목들은 사용한지 좀 지난 후의 상태이고,
벤치마크 프로그램의 버전차도 있기 때문에, 필자의 아트릭스도 벤치를 다시 진행했다.
왼쪽부터 아트릭스(테그라2), 디자이어HD(MSM8255), 넥서스원(QSD8250)으로 모두 1Ghz이다.
감안할 부분은 디자이어HD의 경우 일반 여성 사용자의 것이라 관리상태가 그리 좋지 않을것이라는 점과,
넥서스원의 경우 상대적으로 관리되어있는데다, 진저브레드라는 점을 고려할 필요가 있다.
필자의 아트릭스는 루팅 없이 일반적인 관리만 해왔다.
벤치마크 결과 위의 사항들이 작용하는지 디자이어HD의 성능이 넥서스원과 비슷하게 나왔다.
워낙 변수가 많아 정확한 결과라고는 할 수 없으나, 결과를 평가했을 때,
위에서 예상한 대로 스냅드래곤 2세대가 Cortex-A9의 약 80%정도 성능에 해당하는 계산이 나왔다.
뭔가 수치가 많이 엇갈려서 미묘하지만, 현재로썬 듀얼코어 스냅드래곤 1.5Ghz의 성능이면,
엑시노스 1.2Ghz와 동급이 될 것으로 보인다. 여기선 동성능이 아니라 동급이라는 것에 유의.
실질적으로는 아키텍처가 다르고 클럭이 다르기 때문에 성능면에서 엇갈리는 부분도 있을것이고,
미미한 차이로 듀얼코어 스냅드래곤 1.5Ghz가 엑시노스 1.2Ghz보다 성능이 더 나올 수 있겠다.
여기서 문제되는 것은 듀얼코어의 연계성능인데, 과연 듀얼코어 스냅드래곤이
어느정도의 효율을 보여줄지가 관건이 되겠다.
위에서 언급한 바, 이 효율이 낮아도 당장에는 그리 영향을 주지 않지만,
이후에는 상당한 영향력을 미칠 것으로 예상되기 때문에,
제품의 수명과 직결되는 부분이 있다.
개인적인 예측으로 듀얼코어 스냅드래곤의 효율은 +80%대를 예상하고 있다.
개발기간동안 퀄컴이 무멋을 했냐에 따라 이 수치가 달라질 것이기 때문에,
정말 듀얼코어 스냅드래곤 1.5Ghz 제품이 정말 최강이 될지는
제품 출시까지 기다려봐야 할 것으로 보인다.
공개된 벤치마크 수치를 통한 성능분석
다나와 : '베가레이서 vs 오버클럭 갤럭시s2' 승자는?
http://news.danawa.com/News_List_View.php?nSiteC=4&sMode=review&nSeq=1963044&nBoardSeq=67
어쩌다 보니 조금 늦게 위의 벤치마크가 올라온 것을 확인할 수 있었는데,
이를 토대로 성능을 분석해 보겠다.
먼저 메모리 성능을 보면
QSD 1.5 / Exinos 1.5 / Exinos 1.2 / Tegra2 1.0
1293 / 1139 / 814 / 642
메모리 성능은 거의 CPU 클럭에 따르는 것으로 보인다.
따라서 현재로썬 DDR2 메모리의 성능은 CPU가 따라집지 못하는 상황 이라고 볼 수 있겠다.
단지 기본 메모리 성능은 스냅드래곤 > 엑시노스 > 테그라2 인것으로 보인다.
다음으로 정수 성능을 보면
QSD 1.5 / Exinos 1.5 / Exinos 1.2 / Tegra2 1.0
1683 / 1770 / 1372 / 1123
A8 -> A9로 넘어가면서의 성능향상은 약 5%인 것으로 보인다.
IO에서 OoO로 바뀐것이 그리 성능을 끌어내지는 못하고 있다는 얘기.
혹은 기존 스냅2세대에서 듀얼스냅으로 넘어오는 과정에서
아키텍쳐 수정을 통한 성능 향상이 있었다고 볼 수 있겠다.
다음으로 실수 성능을 보면
QSD 1.5 / Exinos 1.5 / Exinos 1.2 / Tegra2 1.0
819 / 1552 / 1224 / 994
A9가 이번에는 약 90%의 성능이 향상되었음을 알 수 있다.
이것은 매우 큰 성능차이 이지만, 정식 A8 아키텍처인 허밍버드가
대략 160정도, 기존 스냅드래곤이 380정도의 성능을 보였기 때문에,
각각 듀얼코어 적용하면 320, 760정도가 됨에도 불구하고
듀얼코어 스냅드래곤을 1.0Ghz 비율로 적용하면 546밖에 되지 않는다.
이는 A8의 실수 성능이 스콜피온 아키텍처보다 못했다는 점과,
듀얼코어 스냅드래곤의 실수성능 효율이 70%대 이거나,
듀얼코어로 디자인 하면서 실수 성능을 줄였다는 것을 의미한다.
다만, 실수성능이 더 좋지 않았던 허밍버드가 스냅드래곤보다 빠르다고 알려져 있고,
스냅드래곤과 허밍버드의 정수 성능 수치가, 알려진 성능차이와 일치하는 것을 보아,
일반적으로 거론되는 성능차이는 듀얼코어 스냅드래곤이 더 좋을것으로 보인다.
물론 동클럭일 경우에는 동급 혹은 조금 밀리는 형태가 될 것이다.
우려되는 점은 차후 실수 성능의 영향력이 커지는 영역에서는
밀리게 될 수밖에 없어보인다. 따라서 이후 환경 변화의 영향이 있을 듯.
이 경우 1.5Ghz를 채용한 제품은 어느정도 따라가겠지만 그 이하는......
2D 성능은 어차피 CPU 문제가 아니라 GPU 문제이고,
이를 잘 드러내는게, 엑시노스를 오버클럭해도 2D 성능 차이가 없었다는 점에서
별로 의미를 갖는다고 보긴 어렵다. 다만 특이한 것은, 테그라가 161로 성능이 더 좋다는 점.....(.....)
3D 성능은 짚고 넘어가야 할 필요가 있다.
QSD 1.5 / Exinos 1.5 / Exinos 1.2 / Tegra2 1.0
254 / 545 / 277 / 150
3D의 경우 GPU영향을 받는 부분이지만, 처리량에 있어서 CPU의 영향도 무시할 수 없는데,
위 수치에서 주목할 부분은 클럭이 25% 향상됀 것임에도 불구하고 두배에 가까운 성능차가 난 것이다.
이는 엑시노스에 탑재된 GPU가 CPU 성능때문에 제성능을 못내고 있다는 의미이다.
이런 부분은 데스크탑에서도 볼 수 있는 현상인데, 삼성은 엑시노스의 클럭 선정을 잘못한게 아닐까 싶다.
GPU 연산 자체는 대개 FPU 연산이기 때문에 CPU의 실수 성능에는 그리 영향을 받지 않는것으로 보면 되겠다.
따라서 상대적으로 크게 떨어지는 스냅드래곤의 실수성능이 3D를 이용하는 작업에 미치는 영향은 거의 없다고 보면 된다.
데이터베이스 IO 및 SD카드 읽기 쓰기 성능은 여기선 의미가 없으므로 패스.
종합하면
정수성능은 일반적인 명령처리 성능을 좌우하므로 프로그램 실행이나 처리 작업은
다른 듀얼코어 제품들과 거의 클럭 만큼의 성능차를 가져다 줄 것으로 보인다.
반면 실수성능이 테그라2보다 클럭이 1.5배 빠름에도 밀리는점은
실수성능이 멀티미디어 처리 성능을 쥐고 있는 만큼,
GUI 등의 처리 성능이 테그라2에도 못미친다는 얘기이므로
실제 체감 성능면에서는 갈리는 부분이 있을 것으로 보인다.
실용성에서는 유리하지만 체감성능은 그리 좋지 않을것으로 평가되는 부분이다.
쉽게 말해서 같은 어플을 실행시켰을 때 GUI 처리는 그리 부드럽지 않은데,
무언가의 작업 결과는 더 빨리 가져온다는 것이다.
아이폰이 빠르고 부드러운 GUI로 체감성능이 좋다는 점을 생각하면
일반적인 반응속도와 같은 체감 부분은 갤럭시S2에 밀릴 것으로 보인다.
갤럭시S2와 비교해서 아트릭스/옵티머스2X의 체감성능이 20%의 차이임에도
꽤 크게 작용하는 점을 생각하면,
듀얼코어 스냅드래곤을 사용한 제품이 어떨지 대충 짐작이 가능하다.
결과적으론 엑시노스 1.2Ghz와 동급으로 보면 얼추 맞을것으로 보인다.
다만 성능특성이 많이 갈리기 때문에 양쪽에서 강점만을 내세우는 마케팅 구도가 펼쳐질 듯 하다.
우려되는 점은 위에서 언급했던 것처럼 듀얼코어의 효율인데,
이는 역시 MANDRO Bench 결과가 나와야 파악할 수 있을 듯 하다.
미미하게나마 메모리 성능이 좋다는 것이 듀얼코어 효율에 도움이 될 것으로 보이며,
위의 벤치마크 수치가 듀얼코어 효율이 적용된 수치일 것이기 때문에,
듀얼코어 효율이 좋지 않게 나온다면, 싱글코어 성능은 위 결과보다 더 유리하다는 얘기가 된다.
물론 그런다고 성능 특성이 완화되는건 아니지만 말이다....

- 퀄컴 , 스냅드래곤 , 듀얼코어 , 테그라2 , 엑시노스 , 스콜피온 , 허밍버드 , Qualcomm , SnapDragon , DualCore , Tegra2 , Exinos , Scorpion , Hummingbird , 야누스 , 레이서
좋은글 잘 읽었습니다~