测试你对多核多线程的认知程度
目前,多核多线程编程已经成为一种趋势,但大部分程序员还没有从串行程序的思维中走出来。即使有些人对多核多线程的概念有所了解,但也是一知半解,写起多核多线程程序来总是束手束脚。
据Intel预测,到2013年CPU将达到256核。掐指头算一算,也就是还有5年的时间,但留给我们程序员的时间却很少了。这不是危言耸听,现实情况确实如此。如果从现在就开始重视这一问题,不断的学习,并加以积累,相信不久的将来,也许你就比别人多了一次机会。
我曾经对周围的朋友做过一次有趣的调查,调查对象都曾有过多线程编码经验,以此来了解大家对多核与多线程的认知程度。当然不可否认,由于自身知识水平的有限,问卷存在一定的片面性。
样例程序:
- #ifdef __cplusplus
- extern "C"
- {
- #endif
- #include <stdio.h>
- #include <sys/types.h>
- #include <sys/time.h>
- #include <pthread.h>
- #include <unistd.h>
- #define ORANGE_MAX_VALUE 1000000
- #define APPLE_MAX_VALUE 100000000
- #define MSECOND 1000000
- struct apple
- {
- unsigned long long a;
- unsigned long long b;
- };
- struct orange
- {
- int a[ORANGE_MAX_VALUE];
- int b[ORANGE_MAX_VALUE];
- };
- int main (int argc, const char * argv[]) {
- // insert code here...
- struct apple test;
- struct orange test1={{0},{0}};
- unsigned long long sum=0,index=0;
- struct timeval tpstart,tpend;
- float timeuse;
- test.a= 0;
- test.b= 0;
- /*get start time*/
- gettimeofday(&tpstart,NULL);
- for(sum=0;sum<APPLE_MAX_VALUE;sum++)
- {
- test.a += sum;
- test.b += sum;
- }
- for(index=0;index<ORANGE_MAX_VALUE;index++)
- {
- sum=test1.a[index]+test1.b[index];
- }
- /*get start time*/
- gettimeofday(&tpend,NULL);
- /*calculate time*/
- timeuse=MSECOND*(tpend.tv_sec-tpstart.tv_sec)+tpend.tv_usec-tpstart.tv_usec;
- timeuse/=MSECOND;
- printf("main thread:%x,Used Time:%f/n",pthread_self(),timeuse);
- printf("a = %llu,b = %llu,sum=%llu/n",test.a,test.b,sum);
- return 0;
- }
- #ifdef __cplusplus
- }
- #endif
Q1: 您认为样例程序还有优化的空间吗? 如果有,优化后的效率将会提升:
A. 1%~30% B. 30%~50% C. 50%~90% D. 90%以上
Q2: 如果将样例程序修改为两个线程,一个线程用于计算apple的和,另外一个线程计算orange的和,您认为谁的效率会更高?
A. 两线程 B. 单线程(样例程序) C. 不确定
Q3: 基于Q2,再将计算apple的线程拆成两个线程,一个线程用于计算apple a的值(加锁访问),另外一个线程计算apple b的值(加锁访问),第三个线程计算orange的和,您认为谁的效率会更高?
A. 两线程 B. 单线程(样例程序) C. 三线程 D. 不确定
Q4: 基于Q2,在双核CPU系统上,将计算apple的线程绑定到 CPU 0上运行,将计算orange和的线程绑定到 CPU 1上运行,这种方法称为设置CPU亲和力( CPU Affinity ,也叫 CPU 绑定) 您认为谁的效率会更高?
A. 两线程 B. 单线程(样例程序) C. 两线程(CPU绑定) D. 不确定
Q5: 经过分析发现计算orange的和比较快,而计算apple的和比较慢。 基于Q3,将计算apple a的线程和计算orange和的线程绑定到CPU 0上运行,将计算apple b的线程绑定到 CPU 1上运行, 您认为谁的效率会更高?
A. 三线程 B. 单线程(样例程序) C. 三线程(CPU绑定) D. 不确定
Q6: 在Q3中,将程序拆成多线程,需要加锁来访问apple a和b的值,但由于他们访问的是数据结构中的不同属性,也可以不加锁, 此时您认为谁的效率会更高?
A. 加锁访问 B. 不加锁访问 C. 不确定
如果有兴趣的读者,想知道问题的答案,可以看看我的拙作《 利用多核多线程进行程序优化》。
另外一篇文章还在创作过程中,也是针对本文的样例程序进程一系列的优化,效率最终提升了92%。
欢迎大家拍砖!