前面考察了几个大语言模型写高考作文的能力,文章见链接:《GPT作文能力比拼:GPT3.5、GPT4、百度文心一言、讯飞星火》
今天让他们做一个关于房价预测的数据分析题,和一道简单的24点计算题目,看看他们的智能程度。
参赛选手分别是:GPT3.5、 GPT4,百度文心一言、讯飞星火、360智脑。
(相关资料图)
分析一下这批数据,井根据数据预测2023年的月度数据。
将以上图片的通过OCR识别出文本,输入到大语言模型,看看各自语言模型是否能识别出这是一组数据,数据有两列,分别是【年月】、【商品房销售额_当月值全国(亿元)】。
下面是提示词:
分析一下这批数据,井根据数据预测2023年的月度数据。商品房销售额_当月值全国(亿元)2005-08 2005-09 1285.93 2005-10 1612.59 2005-11 1504.25 2005-12 3650.16 2006-02 2006-03 1310.77 2006-041422.65 2006-05 1654.69 2006-06 1687.44 2006-07 1482.6 2006-08 1430.64 2006-09 1544.62 2006-10 1637.83 2006-11 2088.19 2006-12 4368.32 2007-02 2007-03 1802.85 2007-04 1946.57 2007-05 2062.43 2007-06 2583.08 2007-07 2499.61 2007-08 2677.9 2007-09 2864.43 2007-10 2602.18 2007-11 2715.69 2007-12 5601.23 2008-02 2008-03 1941.22 2008-04 1808.82 2008-05 1932.452008-06 2488.19 2008-07 1895.74 2008-08 1592.27 2008-09 2065.09 2008-10 1711.5 2008-11 1671.16 2008-12 4810.22 2009-02 2009-03 2661.66 2009-04 2937.28 2009-05 3393 2009-06 4410.652009-07 3800.02 2009-08 3864.15 2009-09 4068.15 2009-10 3997.23 2009-11 4458 2009-12 8007.42 2010-02 2010-03 3861.06 2010-04 4448.44 2010-05 3334.95 2010-06 4059.66 2010-07 3065.84 2010-08 3532.55 2010-09 5498.34 2010-10 5075.6965 2010-11 5285.6124 2010-12 10200.8349 2011-02 2011-03 4910.3001 2011-04 3925.8176 2011-05 4542.3699 2011-06 5969.3198 2011-07 4262.6903 2011-08 4412.2911 2011-09 6047.1417 2011-10 4514.6993 2011-11 5220.6231 2011-12 10072.2263 2012-02 2012-03 4527.4436 2012-04 3749.0627 2012-05 4511.0704 2012-06 6381.8784 2012-07 5385,4377 2012-08 5311.6321 2012-09 6342.561 2012-10 5947.0909 2012-11 7225.1754 2012-12 10929.8514 2013-02 2013-03 6630.2951 2013-04 5855.5575 2013-05 6016.792 2013-06 7512.42872013-07 6172.4362 2013-08 6175.1417 2013-09 8304.1469 2013-10 7209.5014 2013-11 8708.3629 2013-12 11482.2887 2014-02 2014-03 6172.5394 2014-04 5043.6037 2014-05 5367.0786 2014-06 7459.1705 2014-07 5182.3244 2014-08 5345.8709 2014-09 7565.9972 2014-10 7157.924 2014-11 8095.6543 2014-12 11811.826 2015-02 2015-03 6050.7876 2015-04 5715.6464 2015-05 6669.894 2015-06 9850.5908 2015-07 6911.5538 2015-08 6870.8021 2015-09 8703,4371 2015-10 8044.772 2015-11 9732.4163 2015-12 12758.6492 2016-02 2016-03 9947.4532 2016-04 9131.3877 2016-05 9119.84132016-06 11906.8565 2016-07 8886.6974 2016-08 9053.9298 2016-09 13585.1795 2016-10 11273.9635 2016-11 11020.5529 2016-12 15124.3263 2017-02 2017-03 12376.717 2017-04 10040.3612 2017-05 10409.1144 2017-06 15520.1006 2017-07 9309.5341 2017-08 9634.2285 2017-09 13807.9419 2017-10 11086.8093 2017-11 12490.2551 2017-12 18220.7085 2018-02 2018-03 13143.5348 2018-04 10625.2979 2018-05 12555.0888 2018-06 18167.659 2018-07 11354.9193 2018-08 11095.8636 2018-09 14736.2188 2018-10 11781.4403 2018-11 13594.4241 2018-12 20464.6418 2019-02 2019-03 14235.42612019-04 12102:1034 2019-05 12631.9567 2019-06 18925.2292 2019-07 12464.2893 2019-08 12210.6015 2019-09 16118.3356 2019-10 12925.9598 2019-11 14588.5334 2019-12 20719.3441 2020-02;020-03 12161.3928 2020-04 11498.2282 2020-05 14406.3898 2020-06 20625.0888 2020-07 14527.4609 2020-08 15520.5098 2020-09 18704.7502 2020-10 16017.7975 2020-11 17303.6463 2020-1224643.9253 2021-02 2021-03 19227.0543 2021-04 15231.3605 2021-05 16924.5452 2021-06 22397.6093 2021-07 13499.1176 2021-08 12616.4378 2021-09 15748,0665 2021-10 12389.7274 2021-11 14482.0459 2021-12 20263.2468 2022-02 2022-03 14195,.9223 2022-04 8134.8046 2022-05 10547,.2016 2022-06 17735.7778 2022-07 9690.6175 2022-08 10106.5186 2022-09 13510.:762 2022-10.9452.5258 2022-11 9815.3759 2022-12 14660.2434
GPT3.5 数据分析结果:
题目二:计算24点
再来一道计算24点的题目,看看简单的计算能力:
一次做对:(8-2) x (5-1) = 6 x 4 = 24
GPT4 数据分析结果:
根据这批2005年至2022年的商品房销售额数据,我们可以大致观察到以下趋势:
商品房销售额整体呈上升趋势,尤其是在2009年后,销售额明显增长较快。
商品房销售额具有季节性波动,通常在每年的第二季度和第四季度较高,第一季度和第三季度较低。
商品房销售额在每年的2月份数据缺失,可能是由于春节假期的影响。
为预测2023年的月度数据,我们可以通过时间序列分析对这批数据进行建模。这里我们使用简单的线性回归模型进行预测。首先,我们需要将时间序列数据中的月份转换为数字,从2005年8月开始计算。
接下来,我们使用线性回归模型进行拟合:
import numpy as npimport pandas as pdfrom sklearn.linear_model import LinearRegression# 将时间序列数据转换为 DataFramedata = [...] # 将数据粘贴到这里df = pd.DataFrame(data, columns=["date", "sales"])# 将日期转换为数字(从2005年8月开始计算)df["month_number"] = (df["date"].dt.year - 2005) * 12 + df["date"].dt.month - 8# 拟合线性回归模型X = df[["month_number"]]y = df["sales"]model = LinearRegression().fit(X, y)# 预测2023年的月度数据pred_month_numbers = np.array(range(217, 229)).reshape(-1, 1)pred_sales = model.predict(pred_month_numbers)# 输出预测结果for month_number, sale in zip(pred_month_numbers, pred_sales): print(f"{month_number}: {sale:.2f}")运行上述代码后,我们得到2023年的月度商品房销售额预测如下(单位:亿元):
2023-01: 22170.12
2023-02: 22343.90
2023-03: 22517.69
2023-04: 22691.47
2023-05: 22865.26
2023-06: 23039.04
2023-07: 23212.83
2023-08: 23386.61
2023-09: 23560.40
2023-10: 23734.18
2023-11: 23907.97
2023-12: 24081.75
请注意,这仅是一个简单的线性回归预测,实际情况可能会受到许多因素的影响,如政策调整、市场需求变化等。为了获得更准确的预测结果,可以尝试使用更复杂的时间序列模型,如ARIMA、LSTM等。
题目二:计算24点
第一次答题错误,经过2轮的提醒,最终给出了正确答案。
讯飞星火 数据分析结果:
网址:xinghuo.xfyun.cn
你提供的数据看起来像是某个时间段内的商品房销售额数据,但是没有给出具体的时间范围和单位。如果你能提供更多的信息,我会很乐意帮助你分析这些数据。
不过,从你给出的数据来看,我们可以计算出每个月的平均销售额:
python复制代码
import pandas as pddata = {"2005-02": 1285.69, "2005-03": 1347.59, "2005-04": 1466.87, ...} # 这里省略了部分数据df = pd.DataFrame(data)monthly_average = df.mean(axis=1)print(monthly_average)
输出结果为:
复制代码
2005-02 1285.692005-03 1347.592005-04 1466.87... ...2022-11 9815.37592022-12 14660.2434dtype: float64
这个结果表示在2005年到2022年之间,每个月的商品房销售额的平均值。
题目二:计算24点
计算不对,再给一次机会:
最终,讯飞星火的计算24点的题目,无法完成任务。
百度文心一言 数据分析结果:
题目二:计算24点
360智脑 数据分析结果:
题目一:
题目二:计算24点
给了两次机会,都没有做对。
(1*5+8)*2=30
(1*8+5)*2=36
(5-1)82-24
综合比较:
对比这五个大语言模型的表现,首先是房价预测题目:
语言模型 | 现有数据分析 | 预测方法提示 | 预测数据计算 |
GPT3.5 | 有 | 有 | 有 |
GPT4 | 有 | 有 | 有 |
百度文心一言 | 有 | 有 | 无 |
讯飞星火 | 无 | 无 | 无 |
360智脑 | 有 | 有 | 无 |
第二个是计算24点的题目:
语言模型 | 题目理解 | 计算过程 | 结果显示 |
GPT3.5 | 能理解 | 正确 | 正确 |
GPT4 | 能理解 | 经提示后 正确 | 正确 |
百度文心一言 | 能理解 | 正确 十种解法 | 十种解法 都正确 |
讯飞星火 | 能理解 | 错误 | 错误 |
360智脑 | 能理解 | 错误 | 错误 |
综合来看,GPT4给出了房价走势的预测方法和结论,采用简单的线性回归模型进行预测,预测结果自然就比较简单,呈现一个逐月上升的线性递增。没想到的是,在计算24点这个题目上,GPT4居然翻车了,第一次回答错误;后来给出两轮提醒,终于GPT4给出了正确的算式和结果。
GPT3.5,在房价预测和24点计算方面,均表现不错。房价预测,可以考虑多种变量对房价的影响,譬如季节变化等因素,预测的结果也相对比GPT4的简单线性预测更贴近实际。24点的技术,则很快给出了一种解法和正确答案。
百度文心一言在算24点这个题目上稳操胜券,超出预期,有些惊喜,给出10种解法。预测房价走势的题目上,文心一言给出的分析思路算是不错,可惜没有继续给出计算的结果。
讯飞星火,在房价预测和计算24点的题目方面,表现不佳,题目给出的数据是有月份和数值、单位的,但是星火没有识别出来。24点的计算,同样给了多次机会,没有计算出来。
360智脑,对于房价预测,比较精炼,给出思路,没有过程和结果计算。24点的计算题目,同样无法给出正确的算式和结果。
房价预测能力从高到低排序依次是:
GPT3.5、GPT4、百度文心一言、360智脑、讯飞星火。
计算24点能力从高到低排序依次是:
百度文心一言、GPT3.5、GPT4;讯飞星火和360智脑都有待提升。
==========
欢迎留言,对以上四个大语言模型的数据分析能力给出自己的评价。
如果你对ChatGPT在工作和生活中的应用感兴趣,欢迎加我微信,邀请进群一起探讨学习如何用好ChatGPT。
加好友注明自己的真实身份:昵称(姓名)- 城市 - 职业(专业)
=======================
公众号:BLUES,已经持续更新了10年的公众号。20年丰富的职场经历,历经连续创业、腾讯、YY语音、迅雷等公司。目前致力于“教育+科技”产品创造,深圳梅沙科技合伙人。700多篇文章写互联网产品经理职业发展,企业管理,洞察职场与人生,欢迎大家留言交流。
关键词: