香港科技大学(广州)ACD 智算集群(HPC三期)自 2025 年 1 月 26 日启动上线试运行以来,得到了校内师生的踊跃试用和积极反馈,在此HPC团队对各位老师、同学深表感谢。经过项目团队的不懈努力,持续对系统进行调试与优化,截至 2025 年 4 月,平台运行已趋于稳定。
一、正式上线通知
为进一步提高高性能计算资源的使用效率,更好地服务广大校内用户,HPC 三期平台将于 2025 年 5 月 6 日正式全面上线运行,并在上线之日对计算资源、存储资源启用计费,资源定价详见附件。
正式上线前,请各位用户关注以下事项:
1) 测试账号停用:自本通知发布之日起,平台将停止发放测试账号。平台正式上线后,测试账号将无法提交新的计算任务。
2) 正式账号申请:前期测试用户如需继续使用 HPC 三期平台资源,均需提交正式申请,并使用SSO账号登录。
3) 数据迁移:为防止后续测试数据清理工作造成数据丢失,请已持有测试账号的用户务必在 2025 年 5月31 日前,将重要数据迁移至正式用户账号下。
4) 正式整机租赁申请:在试用期间申请过整机租赁的用户,若希望继续租用,也需重新提交正式的整机租赁申请,以确认租赁数量与时长。
服务申请方式:
l 学生:一站式服务大厅 - HPC AI平台申请 – 服务开通申请/包机租赁申请
l 教职工:钉钉OA审批 - IT services - HPC AI智算平台服务申请 – 服务开通申请/包机租赁申请
二、五一停机维护
为全力保障平台在正式上线后能够稳定、高效地运行,HPC 团队将在平台正式上线前,于 2025 年 4 月 30 日 20:00 至 5 月 5 日 24:00 期间,对平台集群开展停机维护工作。具体影响如下:
1) 维护期间HPC三期平台用户门户(https://hpc3login.hpc.hkust-gz.edu.cn/)和SSH不可访问。
2) SLURM集群所有作业均会停止运行(含运行中、排队中作业),用户家目录数据(/data/user/<username>)不受影响, 但建议做好重要数据备份。
3) AI集群所有作业均会停止运行(含运行中、排队中作业),人工智能模块相关数据(数据集、镜像、项目、conda环境、个人空间等)不受影响, 但建议做好重要数据备份。
请各位用户提前做好相应的安排,由此给您带来的不便,我们深表歉意,感谢您的理解与配合。
如您遇到任何问题,或需要任何帮助,请随时联系我们<hpc@hkust-gz.edu.cn>。
资讯科技处
2025年4月22日