导语:中国大学生计算机设计大赛 - 大数据应用大类 - 大数据主题赛 - 和鲸赛道已于 1 月 28 日正式开赛,作为协办方,和鲸特别邀请到了大赛组委会常务副主任杜小勇教授为广大参赛选手寄语,此外,我们也撰写了本期 Q&A为本届参赛师生解答大赛赛制流程上的若干疑问

希望本文能为广大师生鼓舞参赛士气、解决实际问题,同时,和鲸也衷心期待本届中国大学生计算机设计大赛能够涌现出更多优秀的作品。


(资料图片)

中国大学生计算机设计大赛(下文简称“大赛”)是由教育部认证、我国高校面向本科生最早的赛事之一,自 2008 年开赛起,至今已是第十六届。本届大赛下设不同领域的十一个大类,大数据主题赛属于其中的大数据应用大类,是自 2021 年起新增的子类比赛,和鲸科技自 21 年起就作为协办方配合大赛组委会、大类承办方举办该项赛事,今年已是第三年。目前,2023 年中国大学生计算机设计大赛大数据主题赛 - 和鲸赛道已于和鲸平台正式开赛,本届的赛题为:数据解读气候变化与全球应对

“以赛促学、以赛促教、以赛促创”,和鲸科技特邀大赛组委会常务副主任,中国人民大学校长助理、数据工程与知识工程教育部重点实验室主任杜小勇教授为本届大数据主题赛赛道的参赛选手们寄语:

杜小勇教授:同学们好。大数据主题赛是计算机设计大赛中非常重要的赛道之一。众所周知,现在是数字经济的时代,数据已经成为了重要的生产要素,因此,我们亟需培养大量懂得数据科学,且懂得专业领域的复合型人才。而本次主题赛的目的就是面向全学科,培养并选拔出这样能够懂数据、用数据、分析数据的复合型人才。祝同学们能够在大赛中取得好成绩。

感谢杜小勇教授的寄语,为广大选手们鼓舞了参赛士气。

作为协办方,和鲸在办赛过程中关注到参赛师生目前对于大赛赛制流程等还存在若干疑问,下面我们将以 Q&A 的形式解答常见问题。

问题列表(赛制复杂、篇幅略长,请按需直达对应 Q&A):

1. 大赛主要面向哪些人群?谁可以参赛?

2. 每位选手可以参加多个赛道的比赛吗?参赛队友是否必须为本校生?指导教师是必须的吗?

3. 大赛的赛制流程与晋级逻辑是什么?

4. 选手参赛的必要步骤与重要时间节点是什么?

5. 在和鲸平台点击报名、提交作品就是参赛成功吗?

6. 和鲸平台应如何使用?有没有更详细的操作指南?

Q1:大赛主要面向哪些人群?谁可以参赛?

A1:大赛的参赛对象是中国境内高等院校中所有专业的当年在籍本科生(含港、澳、台学生及留学生),符合以上条件的同学都可以参赛。

Q2:每位选手可以参加多个赛道的比赛吗?参赛队友是否必须为本校生?指导教师是必须的吗?

A2:由于本届大赛的赛程有所改变(详见 Q3),省级赛由各省自行、独立组织,因此其规则并不完全一致,此类细节需参照各省级赛具体的参赛规定,和鲸作为协办方只负责大数据主题赛中的一个赛道,无权解答。但根据往年经验与中大计赛函[2023]1号《关于举办“2023年(第16届)中国大学生计算机设计大赛”的通知》(下文简称“《通知》”),原则上一般不允许选手参加多个赛道的比赛,且每位选手在每一大类只能提交一件作品;省级赛与国赛一般会将参赛队的院校作为评奖单位,故参赛队友原则上限制在本校;根据大赛《通知》,指导教师不是必须的,但由于本大赛的相关通知等一般是自上而下进行传达的,和鲸还是建议选手能够找到指导教师,对于指导教师,大赛会根据相应参赛选手的作品排名与奖项给予星级优秀指导教师的评定

Q3:大赛的赛制流程与晋级逻辑是什么?

A3:本届大赛在赛制流程上与往年有较大区别,以大数据主题赛为例,本年度取消“省级直报赛区*”,改由各个省级赛组委会承办省级赛。其中,省级赛由各省相关学会、研究会、委员会自行、独立组织,换句话说,选手们不再将参赛作品直接提交给直报赛区承办单位,而需提交至各个省赛平台,由省赛组委会组织进行省级复赛评审。注意,各省级赛具体的参赛规则可能有所不同。另外,由于大赛《通知》限制了每一院校在参加国赛时的作品数量(每一小类,如大数据主题赛,作品数应不多于两件;每一大类,如大数据应用大类,作品数应不多于三件),原则上,院校内部应进行校级选拔,校级选拔同样由院校自行、独立组织。

大赛从校赛、省级赛到国赛的晋级逻辑为“上推制”:先由校赛初评并将优秀作品上推省级赛,然后各省级组委会复评并将有效参赛作品30%以内的优秀作品,在“限额*”数量内上推至国赛。特别地,省级赛一等奖作品数一般不高于有效作品数的 10%、二等奖不高于 20%、三等奖占比约 30 - 40%。换言之,并不是所有省级赛的获奖作品均能获得省级上推名额。综上,学生应满足:1)通过校级初赛并被上推入围省级赛;2)通过省级复赛并获得上推入围国赛资格。只有满足以上两个条件,才能够获得国赛的参赛资格。国赛只接受省级赛上推的参赛作品。

*省级直报赛区:指参赛院校的选手直接将参赛作品提交给省级直报赛区的承办单位,统一由直报赛区组委会进行省级评审。

*限额:各省级赛组委会的上推限额数量,与该省级赛区内本届入围国赛参赛院校的数量、上届国赛参赛(如获奖、违规等)情况有关。

Q4:选手参赛的必要步骤与重要时间节点是什么?

A4:对于大数据主题赛 - 和鲸赛道的参赛选手而言,必要的步骤就是在和鲸平台上答题并生成作品链接。和鲸为主题赛提供了基础数据集,广大参赛选手于平台比赛详情页点击报名后即可自由查看与使用;和鲸旗下的数据科学协同工具 ModelWhale 将作为答题平台为参赛选手提供统一的代码开发环境,选手们点击报名后加入比赛组织,即可开始数据探索;答题完成后,参赛选手应在和鲸平台进行项目提交以生成作品链接,该链接可供后续不同的赛程阶段提交使用。

特别提醒,本届大数据主题赛 - 和鲸赛道最终作品提交中“数据处理源程序”部分必须以和鲸平台的作品链接承载,省级赛或国赛组委会将不再接收计算机本地的代码文件,若选手选择在本地编写代码后上传至和鲸平台,请务必确认该代码文件能够在平台上进行复现,为避免不必要的麻烦,和鲸建议广大参赛选手直接在本平台进行系列操作。另外,若选手需提交额外的、作品所需的数据集,该数据集应同样包含于作品链接,可以爬虫的形式呈现于代码,也支持直接以数据集的形式挂载于项目。

有关大赛日程,对于本赛道而言,《通知》中提到了两个重要的时间段 / 时间节点——2023.7.17-2023.7.21,此为既定国赛阶段,该阶段内参加国赛的选手将以答辩的形式呈现自己的作品,国赛组委会将予以评审颁奖;2023.5.30,获得国赛参赛资格的选手们应在此时间节点前通过国赛竞赛平台完成信息填报与核查工作,因此,原则上校级选拔与省级赛的结果都应在此之前告知相关人员,但根据往年办赛经验,此时间节点会根据大赛进程进行调整,一般会有所延后,由国赛组委会另行通知。

Q5:在和鲸平台点击报名、提交作品就是参赛成功吗?

A5:不是。和鲸作为广大参赛选手的答题平台,并不与省级赛、国赛的竞赛平台直接打通;在和鲸平台上“点击报名”,仅作为使用比赛基础数据集、加入比赛组织开始数据探索的依据;在本平台上“提交作品”,仅为了生成作品链接,选手后续应以该链接 + PDF 格式的分析报告作为最终的参赛结果,提交至省级赛或国赛的竞赛平台。特别地,参赛选手可以在和鲸平台上重复提交项目,每次提交均可生成新的作品链接,同时,往次提交将显示“已失效”,选手在提交最终参赛结果时应注意提交最新的、状态显示为“待评审”的作品链接。

Q6:和鲸平台应如何使用?有没有更详细的操作指南?

A6:和鲸平台分为平台比赛详情页(网址见 Q4)所在的和鲸社区与和鲸科技旗下的数据科学协同工具 ModelWhale(网址见 Q4)。对于和鲸社区,广大选手们可自行浏览、学习网站内现存的数据集与项目资源,为参赛答题提供灵感;而对于答题平台 ModelWhale,我们在参赛选手们所加入比赛组织的共享空间内提供了简易的上手指南,选手们在对该指南进行学习后,若仍存在操作上的困难,建议查阅 ModelWhale 用户手册,该手册内囊括了 ModelWhale 所有功能的简介与操作说明,可在上方搜索框内直接搜索功能名称;最后,和鲸作为协办方,将在后续为参与本赛道的选手们举办专门的培训分享会,该分享会内容主要包括:1)和鲸平台使用指南;2)赛题解题思路讲解;3)往届参赛经验分享;培训分享会的具体举办时间将根据各省级赛的日程另行决定,日后会通过大赛微信群等相关渠道通知给本赛道的参赛选手与指导教师。

本届大数据主题赛 - 和鲸赛道选手们所用到的答题工具 ModelWhale 是和鲸旗下的数据科学协同平台。本平台将数据管理分析、编程建模、算力资源管理、团队协同等功能深度整合,支持 Python 及 R 等语言,通过逐级开放的数据基础设施,与 Jupyter Notebook 交互式、Canvas 低代码拖拽式、CloudIDE 三种即开即用的云端分析环境,为研究者们及其团队解决数据安全应用、底层工程繁复、研究成果流转复现困难等问题,使数据驱动的研究变得更为便捷高效。非常欢迎广大参赛师生及相关研究者在大赛结束后同样使用 ModelWhale 开展学习与科研工作。

更多参赛须知细节详见大赛《通知》平台比赛详情页及大数据主题赛官方公告,建议各位参赛师生扫描平台比赛详情页(网址见 Q4)中的二维码添加和鲸赛事助手加入大赛交流微信群,我们将于群内进行重要赛事通知与答疑(添加小助手后点击客服链接,回复或直接点击关键词“大数据主题赛”即可扫码进群)。

作为数据科学行业中的佼佼者,和鲸以一工具平台的角度在帮助各高校搭建教科研体系的时候发现,“教学 - 实训 - 竞赛”一体是数据科学交叉学科人才培养的最佳实践,且这一观点已经获得了各专业领域高校团队的支持——院校们对于“大数据 +”人才培养的目标,不仅希望学生能够掌握统计、编程、机器学习等方面的理论知识或技能,更希望学生能有对相关领域业务需求的理解,因此便需要将其放在真正的实战环境中。从双一流学府到普通高校,作为合作伙伴,和鲸发现“赛训一体、以赛促教”已成为大势所趋

在三年办赛过程中通过与多方教师、学生的沟通交流,和鲸发现有部分参赛队伍的日常水平并不低,甚至处于中上位置,但却会在此“选拔类”大赛中铩羽而归,原因很简单,他们的对手正将比赛融入日常教学,学生们的参赛经验丰富,就容易在大赛中稳定发挥。这也从侧面论证了“赛训一体”的常规化已成为主流,各高校应当与时俱进。

为贯彻“赛训一体、以赛促教”数据科学交叉学科的人才培养理念,同时为广大参赛选手、指导教师提供更好的服务,和鲸科技将在后续联合大赛组委会的范举教授及相关专业的高校学者,举办更多聚焦于此的交流会、培训会,欢迎各位教师、同学的莅临。

针对高校数据科学交叉学科建设市场,和鲸科技集成功能强大的数据科学协同平台 ModelWhale,拥有丰富实战案例资源的和鲸社区,及和鲸科赛多年的办赛经验与比赛模块,打造出了最完备的整体产品及服务体系。我们也希望能用已积累、沉淀的经验与方法论,帮助高校一起梳理需求痛点,进行教科研体系的搭建与完善,为大家带来实质性的帮助。

最后,若您或您的学生有意向参加中国大学生计算机设计大赛大数据主题赛 - 和鲸赛道,作为协办方,我们衷心地期待本届中国大学生计算机设计大赛能够涌现出更多优秀的作品。

主办:中国大学生计算机设计大赛组委会

承办:东华大学

协办:中国人民大学、上海和今信息科技有限公司

推荐内容