我一直认为,所谓的专业,体现在每一个细节,也只有从细节才看看出某个人或者企业的专业程度。就好比老夫的文章连错别字都少于万分之一,所以老夫的文章和文字就是专业的。
然而这些年我一直犯了错误,早些年用过腾讯的“云服务器”,当时就是感觉不行,却也说不出到底哪里不行,反正方方面面都感觉不太对劲。
最近因为朋友的强烈要求,我在腾讯和阿里都搞了香港的虚拟机,顺手进行对比吧。
单纯从性能来讲,整体系统的执行效率,包括但不限于安装、运行软件、数据及数据库操作、网络响应情况等,我没有进行具体的数字化对比,当然这一点来说我不专业,哈哈。从我留意到的所有方面来说,阿里的虚拟机性能比腾讯的大概高一倍以上,这个一倍可能单纯从跑分看的不是特别明显(跑分也肯定会有大幅度差异),但操作几次系统主版本升级、大量文件压缩与解包等这样的事来看,阿里的硬件应该比腾讯的高出至少一代产品(从经验来看估计是2到3代),从网络层面来说,阿里的延迟32,腾讯的44,但偶尔会有小段时间腾讯跳到30,因为单位是毫秒,所以这个感觉不出差异,主观感受,腾讯的延迟高但传输速度似乎比阿里快些。两个都是走的AS4809(也就是坊间流传的CN2)去香港。
然后从系统来看,两家我都在国内和香港有,香港运行的都是linux或者bsd系统,国内的都是windows。先说windows吧,相对而言,阿里的系统模板更像是“发行版”,而腾讯的更像是“花园版”,为什么这么说呢?阿里的win系统,对系统进行定制都用的是微软推荐的方法,比如组策略、自动应答这类,而腾讯的系统很明显是他们装机工搞了系统以后手工调整的,比如打开regedit,你会看到这个装机工最后修改的注册表位置,打开服务器管理器,你会看到装机工最后进行调整的位置,还有其他一些。。。。这很明显是准备ghost的节奏,所以我认为“花园版”这个词是很贴切的。
在腾讯这里,用Linux系统(Debian)的话你会发现1G内存的机型,top报告的物理内存是868M,我日,我一开始以为看错,继而想着这么明目张胆的欺诈不太可能吧,最后找了一下,发现他给装了kdump,然后这玩意会永远抢占一部分物理内存用来处理系统崩溃问题。我日,太外行了吧,我立马看了下阿里的系统,没装这玩意,很干净。腾讯又当了一次装机工,为啥这么说呢,这要从前几天我这一个物理机说起。。。
周五下午,手上一个国内的物理机挂了,因为我这有自动监控,所以分分钟就找过去。作为业余人士,对方技术部门问我能不能重启,我一听这话就来气,说不行,重启会丢数据,你们检查一下是什么情况。于是他们接显示器一看,机器处于关机状态,好吧,那就只能开机了。进系统我第一时间检查了日志记录,发现并不是人为关机,也不是某个软件崩溃关机,不存在任何记录,这是直接断电的节奏,能导致直接断电的肯定是硬件问题了,所以让对方检查,处理。对方速度好快啊,几分钟就跟我说,硬盘换一个吧,是硬盘问题。其实我心里明白这绝对不是硬盘问题,因为*nix系统的话,硬盘出问题不会导致关机的,但是之前打交道的过程中对他们的水准大概心里有数(但肯定都是各种说自己多专业),如果我跟他们多说,他们只会强词夺理,所以随他们吧,返工是少不了的。然后装系统,我这写的很详细了,安装系统的每一个步骤都有配图,有说明,他们愣是干了七八个小时才装好,装好了还tmd不能用,为啥呢?
因为前面说到,硬盘废了绝不会导致*nix关机,再加上系统内没有任何记录,所以可以判断出这是硬件故障导致的直接断电。有了这个前提可以推测出,问题必然在电源、cpu风扇、主板这3个中,为什么这么判断呢?因为基本系统的运作只需要cpu、内存、主板、硬盘、电源,既然硬盘可以排除,而内存挂了会死机,win会蓝屏,但不会断电,那么就只剩下3个了,再加上之前就感觉这机器的性能似乎异常,比较慢,而且换了ssd的盘感觉似乎更慢,综合所有现象来看,电源问题似乎也可以排除,那么概率最大的就是散热了,因为cpu过热而导致触发了过热保护从而直接断电,之前的系统慢也是因为温度保护,为了避免硬件烧毁,所以在cpu过热的时候会主动进行降速,于是就感觉慢了,绝大概率是这么回事。但这个话我还不敢直说,免得对方去琢磨是不是这么回事,而耽误我时间。所以要求对方直接换机器。换了机器以后,我把这些话告诉他们了,信与不信,干与不干,与我无关了。
上面用了这么大篇幅来跑题,是想说一下单纯从装系统的角度来看什么叫外行。不管是win还是*nix,在安装操作系统这个过程中所有的选项和输入项都是可以在安装完成以后进行调整的,也就是说其实只装基本系统是最好的,因为不一定每个人的习惯和需求是相同的,但是装了再删和进系统再加装,则不同,因为装了再删实际上仍然会留下一些文件和痕迹,甚至是很难除去的痕迹,而且这样会增加装系统的时间,这不是没事找事么?腾讯的Debian系统就是这么回事,他在做模板的时候装了kdump,也就是系统崩溃以后会给你留下一些线索来处理,代价就是这玩意会永远占用一部分物理内存(1G机型是占用128M,也就是12.5%),虽然这玩意可以修改grub配置来关掉,但是更新内核会触发update-grub,而这个玩意又会再给你加上参数,足够麻烦了。
我们从常理来分析一下吧,本身云计算就只是个营销词汇而已,并不存在正儿八经的新技术,所以我一直说是虚拟机。本身呢,需要高强度计算的人也不会去买虚拟机,也就是说用虚拟机的人其实对性能没那么高要求,既然没那么高的要求,也就是说负载不高,既然负载不高,那么对*nix来说并不存在系统崩溃的可能性(除非你故意为之),既然没这个可能性,你还把这玩意整上,这不是神经病么?再结合这几次用腾讯虚拟机的细节来看,他们的装机工和电脑城的装机工、以及前两天那个物理机的装机工是一个水平,大多数有选项的时候,都是无脑选中,然后一路确认。我最吐血的是,那货也是无脑选中,居然还给服务器装桌面,我日,我都不敢多说一句话,我特怕哪句话又触动他神经了,再给我多装点什么上去,太tm吓人了。。。
唉,我还是错怪腾讯了,其实他一直在用每一个行为细节昭示着他的业余,而我却没能及时领悟到。我还一直以为这么多年了,他总该有长进吧,可他一直用事实抽我的脸,一次又一次的对我喊着:我腾讯就是这么渣!我腾讯有X钻特权!
好吧,我承认,我错了。
######################
另外的是,这两家对*nix系统版本的模板维护都比较差,我常用的FreeBSD和Debian都没有新版,Debian最近才发新版,你没能及时跟进我能理解(但不认同),而FB的12已经发布半年多了还没加进去,我日。
其实事后想到,腾讯这么做大概率是为了销售而做的,给你整一堆东西,系统性能跟不上,然后业务员打电话给你就可以顺理成章的勾引你买个更大号的虚拟机了。用心良苦啊,我理解,但不认同。
腾讯这个事需要在 /boot/grub/grub.cfg 里面删掉对应的参数:
crashkernel=auto crashkernel=384M-:128M
重新生成配置文件:
grub-mkconfig /boot/grub/grub.cfg
然后重启系统,则内存会从868变成996。最好是把相关的软件包也删掉,不然以后只要触发update-grub就会自动加上参数的,很恶心。