AI训练中心
思腾合力AI开放平台
提供一站式的任务提交功能,极大地简化了用户的操作流程。用户可以通过多种交互方式如SSH、VSCode等访问使用任务,这种灵活性大幅提高了用户的工作效率。通过平台,任务提交变得更加直观和便捷,无论用户的技术背景或偏好如何,都能轻松地管理和执行所需的任务。
# 我的任务
为用户提供模型训练能力,AI训练中心包含的功能有:单机单卡
、单机多卡
、多机多卡
、无卡模式
、ssh
、Jupyter
、Vscode
、缓存盘扩容
、更换镜像
、重置镜像
等功能。
温馨提示,平台默认配置:
- 任务关机
48小时
后将清空缓存盘中的数据
,请在关机前将重要数据存放到共享/对象存储中。 - 任务关机
7天
后,将自动进行释放
操作,请及时备份数据或者点击保存镜像进行保存(保存镜像不会保存缓存盘中的数据)。 - 按量计费的任务关机后GPU将会释放,再次开机时可能面临空闲GPU不足无法开机的情况。
温馨提示,挂载盘路径:
名称 | 路径 | 读写模式 | 备注 |
---|---|---|---|
共享存储 | /root/siton-data-* | 读写 | 可以实现同一地区不同任务之间的文件同步共享 |
对象存储 | /root/siton-object-* | 读写 | 可以实现同一地区不同任务之间的文件同步共享 |
公开数据目录 | /root/siton-pub | 只读 | 思腾合力AI开放平台公开数据目录 |
数据集目录 | /root/siton-dataset | 只读 | 思腾合力AI开放平台数据集目录 |
缓存盘目录 | /root/siton-tmp | 读写 | 计算节点本地目录 |
# SSH服务
温馨提示
思腾合力AI开放平台
上提供的链接非长期有效链接,偶尔会因网络问题而变更,请留意通知。
任务状态由创建中变为运行中后,会生成SSH访问地址以及密码,
- 复制SSH链接,本地打开终端/CMD/Shell,粘贴SSH链接
- 回车后需要输入连接密码,在
我的任务
页面点击复制密码
按钮, - 右键粘贴密码(密码在终端上不显示),再回车即可成功连接到任务
具体使用参考教程与案例
中的远程连接任务
操作
# 便捷工具
温馨提示
思腾合力AI开放平台
上提供的链接非长期有效链接,偶尔会因网络问题而变更,请留意通知。
# Jupyter
任务状态由创建中变为运行中后,会生成Jupyter
的访问地址,具体使用参考教程与案例
中的Jupyter使用
操作
Jupyter
的工作路径为/root
# Vscode
任务状态由创建中变为运行中后,会生成VSCode
的访问地址,具体使用参考教程与案例
中的VSCode使用
操作
VSCode
的工作路径为/root
# Tensorboard
任务状态由创建中变为运行中后,会生成Tensorboard
的访问地址,具体使用参考教程与案例
中的Tensorboard使用
操作
Tensorboard
的日志存放路径为/root/tensorboard
# 自定义服务
如果您希望使用自定义服务,请到我的任务--便携工具--更多--自定义服务
点击打开,使用的端口,您请将自定义的服务以提示的端口启动,便可以通过此入口进行访问。
# 更多
# 无卡模式
当任务关机后,GPU被其他用户占用时,用户可以启用无卡模式来操作任务中的数据。
提示
- 无卡模式配置为:1核心CPU,2GB内存,无GPU卡,配置费用:¥0.10/时,最低消费¥0.01
# 计费变更
当用户根据按时按量
模式启动任务后,他们将拥有选择调整计费方式的灵活性。
用户可轻松选定需调整计费的任务,并将鼠标悬停在更多
功能项上,从中选择计费变更。接下来,根据具体的变更需求,用户可以方便地设置相应的参数,完成调整
# 重置系统
为了提升用户体验,平台特别推出了系统重置功能(关机状态
下可用该功能)。这一功能主要针对因破坏性操作导致的环境崩溃或其他重大不可逆事故而设计。通过系统重置,可以将系统回溯至任务提交的初始阶段,从而确保环境的完整性和用户工作的连续性。
温馨提示
- 注意:重置系统不会针对存储卷(网盘)、缓存盘进行回溯。
# 更换镜像
为了提升用户体验,平台特别推出了更换镜像功能(关机状态
下可用该功能)。
温馨提示
- 注意:更换镜像不会更换缓存盘,即原镜像任务中的缓存盘数据不会因为更换镜像而清空。
# 保存镜像
目前思腾合力AI开放平台
上所有任务都支持保存当前环境的功能(包含机器中除网盘、缓存盘以外的所有文件变动)。
在租用算力
的时候,我们可以选择为大家提供的基础镜像,在进行项目运行、调试的时候,大家可能会在基础镜像上进行修改,比如安装第三方python包、自己conda创建了新的虚拟环境、apt安装了其他系统工具等,默认释放机器时会直接清除所有机器环境。
如果您想保存这些修改,您可以在我的任务--更多--保存镜像
进行保存环境,保存成功后,下次创建任务
时可以直接选择使用
。
# 作业监控
温馨提示
- 资源使用率查不是实时显示,后台默认
分钟级
查询
思腾合力AI开放平台
提供查询当前任务使用率的功能,在我的任务中,我的任务--操作--更多--作业监控
即可看到任务中的CPU、内存、硬盘、网络、运算卡的使用情况。
# 缓存盘扩容
在计费模式体系中,平台支持缓存盘动态扩容功能。平台提倡用户为了加速计算,建议用户将模型以及数据暂存在缓存盘中进行计算,避免网络、存储性能等多方因素带来的干扰,从而大幅提升运算效率。
# 任务迁移
温馨提示
- 功能开发中
# 操作记录
目前思腾合力AI开放平台
上允许用户查看当前任务的操作日志
# 任务升配
当用户不满足当前配置但又不想重新提交任务的情况下可以选择该功能任务升配
点击任务升配-输入大于当前任务的规格数量进行配置升级
# 任务续租
温馨提示
- 功能开发中
# 使用时长
温馨提示
- 该功能为
管理用户
独有功能
为了使管理员能够更直观地统计和分析平台用户提交的任务情况,平台新推出了使用时长统计功能。这一功能不仅提供对任务和用户两种不同维度的查看方式,还支持将相关数据导出为表单,以便进行更深入的分析和记录。
# 任务配置
# 任务释放时间配置
温馨提示
- 该功能为
管理用户
独有功能,默认为关闭状态!
为了实现平台资源的高效利用,管理员用户被赋予了通过任务设置功能来配置任务的关机时间和释放时间的能力。这样的设置确保了资源的最优分配,同时提升了整体运营效率