文件传输

用户数据存储空间

在计算云上,系统根据三种使用模式会为用户在共享文件系统上分配三种目录:

  • 每位用户会分配一个个人目录用于私有实例,路径为 /home/USERNAME

  • 每个用户分配一个共享文件系统上的目录,作为独占集群里的Home目录,路径为 /group_homes/PRIVATE_CLUSTER/home/USERNAME

  • 对于加入公共集群的用户,系统会为用户在公共集群中分配一个Home目录,路径为 /group_homes/PUBLIC_CLUSTER/home/USERNAME

在公共集群中,不管用户登录到那套集群,用户的HOME目录信息均保持一致。用户在自己的各种独占集群实例中看到的HOME结构也保持一致。用户的私有实例也都共享同样的HOME目录结构。

在用户的私有实例中,可以通过/group_homes目录访问到在公共集群和独占集群里的数据。

image0

Web页面数据传输

平台支持通过Web页面上传下载数据和管理文件。

小心

通过Web页面上传和下载文件有数量限制,每次最多上传10个文件,下载1个文件。

  • 私有实例

点击我的资源,进入数据管理, 可以看到Home目录下的子目录和文件。

image3

  • 共享实例

点击共享资源,进入共享项目,点击数据管理

image2

  • 独占集群

类似共享实例,进入独占集群项目,点击数据管理

image2

  • 公共集群

类似共享实例,进入共享集群项目后,点击数据管理

image1

通过ssh账户传输

由于Web传输文件功能有限,对于开放了SSH端口的集群或实例,用户可以通过SSH账户使用scp类的工具来传输数据。

image4

以公共集群项目为例,用户在公共集群lzu_public的页面里,选择科研实例,点击实例最右侧的SSH服务地址按钮,会弹出平台对外开放的IP地址和端口:

image5

首次使用SSH登录的用户需要 重置平台密码

reset_pw

用户在校内,能够直接访问平台服务IP地址的情况下,可以使用scp、WinSCPXmanager等scp工具来传输数据:

scp -P 20139 some_data username@ssh_ip:/home/USERNAME/

WebDAV 协议访问

由于不是所有实例都提供SSH端口的访问方式,对于需要批量上传或下载的用户,平台还提供了WebDAV协议的文件访问方式。

WebDAV是一种通信协议,支持大批量的文件传输。对于用户来说,相当于将平台的服务器以网盘的形式挂载到用户的个人电脑,用户将个人电脑里的数据拷贝或者上传到平台的服务器上。

WebDAV协议访问的地址是http://202.201.1.198:4918 。用户验证请使用平台用户名密码

Windows系统建议使用RaiDriveCyberduck。Mac系统建议使用Cyberduck。Linux系统建议使用rclone

为了方便,平台提供了上述软件,请根据需要下载:

Mac:

Windows:

Linux:

Cyberduck使用说明

打开Cyberduck,点击“新建连接”,按照下图所示填写连接方式,要选择“WebDAV(HTTP)”方式。用户验证请使用平台用户名和密码。

cyberduck connect lzu

连接过程中出现任何提示,直接点“继续”。连接成功后,可以使用软件的创建文件夹、上传等功能。注意,使用共享实例,比如交互式的JupyterLab、RStudio、Stata、MATLAB的用户,目标文件夹是“MyData”文件夹。软件的“操作”按钮下有“新建文件夹”、“上传”等功能。

RaiDrive使用说明

下载RaiDrive并安装后,点击窗口顶部的“添加”按钮,按照下图所示创建WebDAV驱动器。

raidrive connect lzu

点击确定后,会跳出一个Windows资源浏览器窗口。RaiDrive已经把新添加的WebDAV连接创建成了一个网络存储驱动器,可以像操作本地磁盘一样从其他驱动器里拖拽文件或者拷贝到这个驱动器下的子目录中。

注意

RaiDrive WebDAV驱动器功能有局限

  • WebDAV驱动器里的文件不支持编辑,只支持创建和删除。

  • 根目录下不能创建目录或文件,只能在列出的顶层目录下操作。

WinSCP使用说明

打开 WinSCP ,在登录对话框中“新建站点”。按下图所示,选择“WebDAV”-“TLS/SSL隐式加密”、主机名:”202.201.1.198”、端口号:4918,然后注册平台时的用户名和密码进行登录

winscp connect

rclone使用说明

1.下载rclone压缩包

官方链接地址 https://downloads.rclone.org/v1.55.1/rclone-v1.55.1-linux-amd64.zip

2.将rclone程序拷贝到自己服务器(非学校平台)的路径下并解压,然后编辑.bashrc,添加rclone的路径:

export PATH=/YourPath/rclone-v1.55.1-linux-amd64:$PATH

3.配置 rclone config

#rclone config
cd rclone-v1.55.1-linux-amd64
> n    #新建连接
name> remote    #设置连接名称
Storage> webdav    #设置存储类型
url> http://202.201.1.198:4918   #设置webdav服务端地址
vendor>other     #设置服务端vendor
user> zhangsan      #设置eaas平台账号
y/g/n> y
password: ******    #设置eaas平台密码
bearer_token>       #键入回车,跳过
Edit advanced config? (y/n)  #键入回车,跳过
Remote config       #键入回车,跳过
e/n/d/r/c/s/q> q     #配置完成,退出

以上操作结束后,可以在/root/.config/rclone/rclone.conf 中看到相应配置文件

4.关闭证书检查

注意

注意:此项必须关闭,不然远程操作会报错。

有两种关闭检查的方式,如下:

  • 1.在执行命令时带上“–no-check-certificate”参数,如:rclone ls remote: –no-check-certificate

  • 2.在环境变量里指定,如:export RCLONE_NO_CHECK_CERTIFICATE=true

5.rclone常用操作

# 列出远程目录,remote替换为配置时设置的连接名称
rclone lsd remote:
       -1 2021-09-30 15:38:05        -1 MyData
       -1 2021-10-19 09:11:48        -1 ProjectGroup(lzu_arm_cluster)
       -1 2021-10-19 09:11:45        -1 ProjectGroup(lzu_public)
       -1 2020-06-22 11:52:58        -1 ProjectGroup(new_proj)
       -1 2021-09-14 21:11:41        -1 ProjectGroup(testhpc)

# 将本地文件复制到远程的实例MyData目录
rclone copy -P /tmp/*  remote:/MyData/

#远程公共集群目录下的文件复制到本地(注意:公共集群下ProjectGroup(lzu_public)等路径名称需要加引号,以免Linux不识别括号造成的无法访问。)
rclone copy -P remote:/'ProjectGroup(lzu_public)'/file /tmp

6.其它操作可参考官方文档:https://rclone.org/docs/

虚拟机实例内访问Home目录

平台内的虚拟机实例访问共享文件系统上的Home目录的机制类似于用户从外部访问WebDAV服务。目前平台提供Windows和Linux虚拟机,连接方法分别如下:

  1. Linux虚拟机:在Linux虚拟机镜像中已经预先做好了WebDAV卷的自动挂载,挂载点是/webdav,可以直接访问 /webdav/MyData/ 目录下的文件。

  2. Windows虚拟机:在Windows虚拟机中也预先做好了WebDAV卷的自动挂载,原理是使用Windows自带的WebDAV Client工具挂载了WebDAV服务端提供的网络存储。其中,MyData存放的是个人数据,ProjectGroup(public_cluster)存放的是public_cluster项目组中的数据,其它项目组同理。如下图:

windows webdav client

算例数据可以通过这种方式拷贝到C盘目录去处理,处理完再从C盘拷贝到网络存储的目录中,然后从实例的数据“管理页面”下载到自己的电脑。

提示

通过系统平台的数据管理页面下载时,对下载的文件数量有限制,建议先在虚拟机中对处理结果打包后再传输。

Windows系统自带的WebDAV Client可以满足大多数文件拷贝需求,但是对单个文件的大小限制为4G,文件如果大于4G会报错。

transfer error

此时,需要在虚拟机里安装WinSCP工具来拷贝文件,参考前面软件下载部分。以下以RaiDrive软件为例:

首先下载RaiDrive并上传到虚拟机中,安装RaiDrive需要.net framework的支持,会提示下载安装,默认安装即可。另外,可能会要求重启虚拟机系统,重启即可。

安装完成后,新建站点并输入以下信息进行连接,“文件协议”-“WebDAV”,不加密,连接地址为http://10.0.255.254:4918,Account即平台的用户名、密码。

winscp vm connect

winscp vm connect 2

连接建立成功后,会自动打开数据目录,再进行文件传输即可。

winscp vm connect 3