Everything, Nothing ...

Wednesday, July 09, 2008

MS4.0在安腾IA64位服务器上的安装总结

1.操作系统的选择

MS安装指南里 System requirements and recommendations部分说明IA64 Linux可用以下版本
Red Hat Enterprise Linux AS, ES, and WS - 3.0 (updates 4 and 5) and 4.0
SuSE Linux Enterprise Server 9 - SP2 (for standalone execution of CASTEP, Discover, and DMol3 only)
但实际测试发现Itanium 2 Linux中只有以下版本支持JRE1.4.2
Red Hat Enterprise Linux WS 3.0 Gnome2.2.2-metacity 2.4
Red Hat Enterprise Linux ES 3.0 Gnome2.2.2-metacity 2.4
Red Hat Enterprise Linux AS 3.0 Gnome2.2.2-metacity 2.4
Red Hat Enterprise Linux WS 2.1 Gnome-sawfish 1.0
Red Hat Enterprise Linux ES 2.1 Gnome-sawfish 1.0
Red Hat Enterprise Linux AS 2.1 Gnome-sawfish 1.0
SUSE Linux Enterprise Server (SLES) 8 Gnome2-metacity 2.

详见http://castep.bokee.com/viewdiary.180187010.html

如果在其他版本的操作系统上安装MS4.0会出现"Bundled JRE is not binary compatible with host OS/Arch or it is corrupt. Testing bundled JRE failed."的错误。这个问题困扰我好久,网上一直没找到解决方法,在反复多次实验后终于发现是OS版本的问题。

2.在所有节点上安装HPMPI,rpm -ivh /tmp/hpmpi-2.01.00-08.ia64.rpm

3.切换到MS的用户名,安装MS,注意要加cluster参数以用于并行 Install --type cluster

4.安装授权文件

5.配置各节点/etc下hosts入各节点IP和域名,在hosts.equiv文件中加入各节点域名,将hosts.equiv拷贝到用户主目录中并更名为.rhosts

6.修改/etc/exports文件,将MS安装目录共享出去

7.在其他节点上挂载MS安装目录mount -t nfs -o rw,sync,hard,intr ia02:/home/msi/ms /home/msi/ms

8.根据需要配置RSH或SSH

SSH参考帮助里的方法就可以了,在各节点上ssh-keygen -t rsa,然后三个回车,将各节点生成的id_rsa.pub文件合并成一个并改名为authorized_keys2放入各节点的用户主目录下.ssh文件夹中。

配置RSH时可以用rpm -qf `which rlogin` 查看一下目前使用的rlogin是从哪个套件产生的,如果是krb5-workstation就用以下命令rpm -e krb5-workstation 把他卸载 ,不然后出现Trying krb4 rlogin… Connection refused的错误。

9.修改参与计算CPU个数

vi share/data/machines.LINUX

venus:2 //节点名:CPU个数
earth:2
mars:2

vi Gateway/root_default/dsd/conf/gwparams.cfg //修改CPU总数

vi Gateway/root_default/dsd/conf/gw-info.sbd //修改CPU总数
10.配置网关自启动

cp msgateway_control_18888 /etc/rc.d/init.d

/sbin/chkconfig --add msgateway_control_18888

11.IA64上的大量floating-point assist fault 出错提示屏蔽

在用于安装MS的用户登录脚本login script (.profile, .bash_profile, .login, etc.) 里加入下面一行:

prctl --fpemu=silent
以上只是一些注意事项,其他细节参考MS的README_MS_Modeling.htm文件中关于安装卸载部分就可以搞定了,以上是在安腾服务器上安装的步骤,其他架构CPU机器上的安装要简单的多。

No comments: