看看函数名和注释,AI自动生成代码,程序员:这不真实,我要失业
机器之心报道
参与:张倩、Racoon X、Jamin
你有没有想过,有一天,码农是不需要写代码的。你只需要提供函数签名和注释,代码就能自己在屏幕上打出来。「搬砖码农可以都辞退了,留下项目经理提需求即可,大雾!」
上面这段 demo 是不是看着很爽?这就是 OpenAI CEO Sam Altman 刚刚介绍的最新研究成果——根据函数签名和注释,利用语言模型自动生成 Python 代码。这个语言模型用到了和 OpenAI 的 GPT 模型相同的无监督技术。
为了让模型学会「写代码」,研究人员在微软的超级计算机上,借助数千个开源 GitHub 库里的代码对该模型进行了微调。
先来看一下生成效果。
研究人员首先展示了一个较为简单、使用 Python 编写回文检测的例子。回文指的是「正读反读都能读通的句子」,例如:「anna」、「level」等。下面是使用该模型自动生成的代码:
可以看到,在你输入了函数签名和注释之后,模型正确地生成了回文检测的代码。当然,对于回文检测,我们也可以用如下更「秀」的递归方法来实现:
看到这里,也许大家并没有对该模型的效果感到很惊艳,毕竟像回文检测这类基础任务的代码网上一抓一大把,模型大可以直接从训练集中复制过来即可。
先别着急,咱们继续往下看。
接下来,研究人员要求模型生成从一个列表中查找长度不少于 7 个字符的代码,而且该任务并没有在训练集中。我们来看看在这样的情况下,模型表现如何:
还是出色地完成了任务!
从这个例子我们可以确定,模型不是简单地复制网上的现成代码,而是依据函数名及相关注释产生了对应的解决方案,它甚至还使用了之前生成的代码。
试过了单一函数的例子,研究者还展示了其在类中的运行效果。
这次的任务是计算商品的总价格,并对名称是回文的商品打折。我们来看一看该模型生成的代码:
模型自动地为我们生成了计算商品总价方法的注释及对应代码。然而这并不是我们想要的结果,我们只想要对名字是回文的商品打折,而不是对所有商品都打八折。研究人员之后修改了该方法的注释,详细描述了想要实现的功能。修改注释后,该模型生成的代码如下:
可以看到模型几乎生成了我们想要的结果。这里仅有一个小问题,我们想要对回文名称的商品打八折,而不是打二折,简单修改一下即可。
最后研究者展示了让模型生成购物收据的结果:
OpenAI 的介绍视频
OpenAI 放出的 demo 的确惊艳,甚至是革命性的。如果照这个思路走下去,以后简单的「搬砖工」似乎都不需要了。但问题也出在这儿:效果未免太惊艳了,让人不禁怀疑是否存在造假或精心挑选……
不过也有人说,「这可是 OpenAI!他们的口袋里有的是好玩意儿。」
那么,如果这是真的,对程序员来说意味着什么?
程序员的未来何去何从?
在 AI 领域,每种新鲜技术的出现似乎都会掀起一番「XX 从业者是否会被 AI 取代」的讨论,这次也不例外。
首先,这种工具的出现所带来的效率提升是毋庸置疑的。我们假设这个 demo 是没有掺水的,那么公司可能会出于成本的考虑裁掉一些初级码农,用一个码农来充当「审码员」,完成原来十个码农的工作。
也有人认为,就目前这个模型来讨论程序员是否会被取代未免有点超前。首先,这还只是一个语言模型,即使在非常简单的函数中也可能出错,更别说遇到比较难以理解的自然语言注释语句了。这时候,还是需要人来介入。
其次,这一流程中用到的「注释」还不是需要人来写吗?
但也有人认为,这些都可以通过时间和技术来解决:总有一天,模型犯的错误会越来越少,甚至少于检查代码的那个人类。
或者你再训练一个模型来写单元测试,然后不断对其进行改进,直到它可以给出大部分时候合理的解决方案。
当然,这些都是一些非常超前的假设,现在的技术还很难做到,真正应用起来也会有各种各样的问题。但回想起 19 世纪初期大批纺织工人的命运,这种讨论还是很有意义的。
参考链接:https://www.reddit.com/r/MachineLearning/comments/gnmjki/dn_microsoft_demos_language_model_that_writes/
自定义代码生成器(上)
在项目开发过程中,有很多业务模块的代码是具有一定规律性的,例如controller控制器、service接口、service实现类、mapper接口、model实体类等等,这部分代码可以使用代码生成器生成,我们就可以将更多的时间放在业务逻辑上。
传统的开发步骤:
创建数据库和表 根据表设计实体类 编写mapper接口 编写service接口和实现类 编写controller控制器 编写前端页面 前后端联调
基于代码生成器开发步骤:
创建数据库和表 使用代码生成器生成实体类、mapper、service、controller、前端页面 将生成好的代码拷贝到项目中并做调整 前后端联调
我们只需要知道数据库和表相关信息,就可以结合模版生成各个模块的代码,减少了很多重复工作,也减少出错概率,提高效率。
(1)需要对数据库表解析获取到元数据,包含表字段名称、字段类型等等
(2)将通用的代码编写成模版文件,部分数据需使用占位符替换
(3)将元数据和模版文件结合,使用一些模版引擎工具(例如freemarker)即可生成源代码文件
FreeMarker 是一款 模板引擎: 即一种基于模板和要改变的数据, 并用来生成输出文本(HTML网页,电子邮件,配置文件,源代码等)的通用工具。 它不是面向最终用户的,而是一个Java类库,是一款程序员可以嵌入他们所开发产品的组件。
模板编写为FreeMarker Template Language (FTL)。它是简单的,专用的语言, 在模板中,你可以专注于如何展现数据, 而在模板之外可以专注于要展示什么数据。
(1)动态页面
freemarker可以作为springmvc一种视图格式,像jsp一样被浏览器访问。
(2)页面静态化
对于一些内容比较多,更新频率很小,访问又很频繁的页面,可以使用freemarker静态化,减少DB的压力,提高页面打开速度。
(3)代码生成器
根据配置生成页面和代码,减少重复工作,提高开发效率。
(1)创建freemarker-demo模块,并导入相关依赖
(2)application.yml相关配置
(3)创建启动类
(4)创建Student模型类
(5)创建StudentController
(6)在resources/templates下创建01-index.ftl模版文件
(7)测试
浏览器访问 http://localhost:8881/student/index
效果如下
(1)注释,即<#– –>,介于其之间的内容会被freemarker忽略
(2)插值(Interpolation):即 ${..} 部分,freemarker会用真实的值代替${..}
(3)FTL指令:和HTML标记类似,名字前加#予以区分,Freemarker会解析标签中的表达式或逻辑。
(4)文本,仅文本信息,这些不是freemarker的注释、插值、FTL指令的内容会被freemarker忽略解析,直接输出内容。
if 指令即判断指令,是常用的FTL指令,freemarker在解析时遇到if会进行判断,条件为真则输出if中间的内容,否则跳过内容不再输出。
格式如下
需求:根据年龄输出所处的年龄段
童年:0岁—6岁(周岁,下同) 少年:7岁—17岁 青年:18岁—40岁 中年:41—65岁 老年:66岁以后
实例代码:
(1)在01-index.ftl添加如下代码
(2)测试
浏览器访问http://localhost:8881/student/index
效果如下
list指令时一个迭代输出指令,用于迭代输出数据模型中的集合
格式如下
迭代集合对象时,包括两个特殊的循环变量: (1)item_index:当前变量的索引值。 (2)item_has_next:是否存在下一个对象
item_index 和 item_has_nex 中的item为<#list items as item> 中as后面的临时变量
需求:遍历学生集合,输出序号,学生id,姓名,所处的年龄段,是否最后一条数据
(1)在StudentController中增加方法
(2)在resources/templates目录下创建02-list.ftl模版
(2)测试
浏览器访问http://localhost:8881/student/list
效果如下
include指令的作用类似于JSP的包含指令,用于包含指定页,include指令的语法格式如下
(1)filename:该参数指定被包含的模板文件 (2)options:该参数可以省略,指定包含时的选项,包含encoding和parse两个选项,encoding 指定包含页面时所使用的解码集,而parse指定被包含是否作为FTL文件来解析。如果省略了parse选项值,则该选项值默认是true
需求:\”早上好,尊敬的 某某 用户!\” 这句话在很多页面都有用到,请合理设计!
(1)在resources/templates目录下创建00-head.ftl模版,内容如下
(2)在resources/templates目录下创建03-include.ftl模版,使用include引入00-head.ftl模版,内容如下
(3)在StudentController中增加方法
(4)测试
浏览器访问http://localhost:8881/student/include
效果如下
它用于为该模板页面创建或替换一个顶层变量
(1)算数运算符
FreeMarker表达式中完全支持算术运算,FreeMarker支持的算术运算符包括:
- 加法: +
- 减法: –
- 乘法: *
- 除法: /
- 求模 (求余): %
(2)比较运算符
- =或者==:判断两个值是否相等.
- !=:判断两个值是否不等.
- >或者gt:判断左边值是否大于右边值
- >=或者gte:判断左边值是否大于等于右边值
- <或者lt:判断左边值是否小于右边值
- <=或者lte:判断左边值是否小于等于右边值
比较运算符注意
- =和!=可以用于字符串、数值和日期来比较是否相等
- =和!=两边必须是相同类型的值,否则会产生错误
- 字符串 \”x\” 、\”x \” 、\”X\”比较是不等的.因为FreeMarker是精确比较
- 其它的运行符可以作用于数字和日期,但不能作用于字符串
- 使用gt等字母运算符代替>会有更好的效果,因为 FreeMarker会把>解释成FTL标签的结束字符
- 可以使用括号来避免这种情况,如:<#if (x>y)>
(3)逻辑运算符
- 逻辑与:&&
- 逻辑或:||
- 逻辑非:!
逻辑运算符只能作用于布尔值,否则将产生错误 。
(1)缺失变量默认值使用 “!”
- 使用!要以指定一个默认值,当变量为空时显示默认值
- 例: ${name!\’\’}表示如果name为空显示空字符串。
- 如果是嵌套对象则建议使用()括起来
- 例: ${(stu.bestFriend.name)!\’\’}表示,如果stu或bestFriend或name为空默认显示空字符串。
(2)判断某变量是否存在使用 “??”
用法为:variable??,如果该变量存在,返回true,否则返回false
例:为防止stus为空报错可以加上判断如下:
内建函数语法格式: 变量+?+函数名称
(1)求集合的大小
${集合名?size}
(2)日期格式化
显示年月日: ${today?date} 显示时分秒:${today?time} 显示日期+时间:${today?datetime} 自定义格式化: ${today?string(\”yyyy年MM月\”)}
(3)内建函数c
model.addAttribute(\”point\”, 102920122);
point是数字型,使用${point}会显示这个数字的值,每三位使用逗号分隔。
如果不想显示为每三位分隔的数字,可以使用c函数将数字型转成字符串输出
${point?c}
(4)将json字符串转成对象
一个例子:
其中用到了 assign标签,assign的作用是定义一个变量。
(5)常见内建函数汇总
内建函数测试demo1
(1)在StudentController新增方法:
(2)在resources/templates目录下创建04-innerFunc.ftl模版页面:
(3)测试
浏览器访问http://localhost:8881/student/innerFunc
效果如下
内建函数测试demo2
需求:遍历学生集合,显示集合总条数,id不要逗号隔开,显示学生的生日(只显示年月日),钱包显示整数并显示单位元,用户姓名做脱敏处理(如果是两个字第二个字显示为星号,例如张三显示为张*,如果大于两个字,中间字显示为星号,例如成吉思汗显示为成*汗,诸葛亮显示为诸*亮)
(1)修改StudentController中的list方法,
(2)修改02-list.ftl模版
共${stus?size}条数据:输出总条数
stu.id后面加?c:id不需要逗号分割
stu.birthday后面加?date:生日只输出年月日
stu.money后面加?int:金额取整
姓名需要使用replace和substring函数处理
完整内容如下
(3)测试
浏览器访问http://localhost:8881/student/list
效果如下
(1)springboot整合freemarker静态化文件用法
编写springboot测试用例
(2)freemarker原生静态化用法
元数据(Metadata)是描述数据的数据。
数据库元数据(DatabaseMetaData)就是指定义数据库各类对象结构的数据。
在mysql中可以通过show关键字获取相关的元数据
也可以从 information_schema库中获取元数据,information_schema数据库是MySQL自带的信息数据库,它提供了访问数据库元数据的方式。存着其他数据库的信息。
在代码中可以由JDBC的Connection对象通过getMetaData方法获取而来,主要封装了是对数据库本身的一些整体综合信息,例如数据库的产品名称,数据库的版本号,数据库的URL,是否支持事务等等。
DatabaseMetaData的常用方法:
(1)导入mysql依赖
(2)创建测试用例
(1)获取数据库元信息综合信息
(2)获取数据库列表
(3)获取某数据库中的所有表信息
(4)获取某张表所有的列信息
参数元数据(ParameterMetaData):是由PreparedStatement对象通过getParameterMetaData方法获取而 来,主要是针对PreparedStatement对象和其预编译的SQL命令语句提供一些信息,ParameterMetaData能提供占位符参数的个数,获取指定位置占位符的SQL类型等等 以下有一些关于ParameterMetaData的常用方法:
结果集元数据(ResultSetMetaData):是由ResultSet对象通过getMetaData方法获取而来,主要是针对由数据库执行的SQL脚本命令获取的结果集对象ResultSet中提供的一些信息,比如结果集中的列数、指定列的名称、指 定列的SQL类型等等,可以说这个是对于框架来说非常重要的一个对象。 以下有一些关于ResultSetMetaData的常用方法:
创建maven工程并导入以下依赖
目录结构如下
本文作者及来源:Renderbus瑞云渲染农场https://www.renderbus.com
文章为作者独立观点不代本网立场,未经允许不得转载。