szjuliet 发表于 2023-9-16 22:37:11

【App Inventor数据可视化】使用电子表格和图表4:在App中添...

本帖最后由 szjuliet 于 2023-9-22 20:06 编辑

【App Inventor数据可视化】使用电子表格和图表
Part 4:在App中添加数学模型


[*]在图表中添加“最佳拟合线”(也称为最小二乘回归线),以加深对数据的理解,并对湖泊的未来做出预测

Part 1:通过图表理解数据
Part 2:通过比较数据集加深理解
Part 3:通过比较多个例子收集证据
Part 4:在App中添加数学模型
附录A:将app连接到自己的数据集
附录B:为Google表格创建一个凭证


## Part 4:在App中添加数学模型

Janelle 研究了Spirit Lake的冰和温度图表,以了解它的历史。她将Spirit Lake与其他湖泊进行了比较,并开始在数据中发现有趣的模式。但她想进一步确认。

理解可视化数据的下一步是添加数学模型 -- 简单而准确地表示数据的一条线。如Part 2末尾所述,模型是通过处理公式中的数字来创建一条称为“最佳拟合线”或“最小二乘回归线”的线来创建的。
![](https://markdown.liuchengtu.com/work/uploads/upload_5ca8963044915b8337324b1909257ca5.png)

添加模型可以帮助Janelle完成一些特殊任务。她可以:

* 厘清趋势,更好地理解数据

* 报告模型在准确表示数据方面的置信度

* 预测研究对象的未来行为(在本例中是Spirit Lake!)

本节中讨论的一些术语对于那些学习过一些高中代数和统计的人来说会更熟悉。

### 1. 获取App模板。

* 下面链接的修改模板提供了本指南第1、2和3部分的代码,并添加了一种添加数学模型的方法 -- 一条简单准确地表示数据的线。

* 找到[包含本课程的文件夹](https://drive.google.com/drive/folders/19po9j10qU5yXHJDqBNRJ5JZIB3xoanE0?usp=sharing)中提供的文件((https://drive.google.com/file/d/1hY7W9pLwO9zGWjDEW72tknA57ttvxgag/view?usp=drive_link))。(如链接打不开,可在附件中下载)

* 把文件下载到你电脑的硬盘上。注意保存文件的位置。

* 进入App Inventor (http://ai2.appinventor.mit.edu),或国内可正常访问的(http://code.appinventor.mit.edu),从电脑中导入下载的AIA文件。

* 创建一个模型就是将图上的每个数据点放入一个公式中,称为“最佳拟合线”或“最小二乘回归线”。(你可以自己看看下面AIA文件中紫色代码块中的数字是如何处理的。)对于本例,我们使用了线性回归线,但也可以使用许多其他的例子。


| 测试代码|
| -------- |
| 查看修改后的Show Lake Ice Duration and Temperature屏幕。   |
|按"**ShowData**"按钮(如前所述,你可能需要按额外的时间,这取决于你的网速。):    |
| 图表出现后,按“Show Line of Best Fit”按钮   |
|![](https://markdown.liuchengtu.com/work/uploads/upload_b8ae4f63a0ca73fd2dd71ac16ccd02b5.png)      |
| ![](https://markdown.liuchengtu.com/work/uploads/upload_f32d08f833168d2c9bae8b43cde4ce81.png)    |

**讨论:从这些图表中你能看出什么?**

看看两个屏幕上的数学模型 -- **Lake Ice and Temperature** 和 **Compare Lakes**。思考以下问题:

1. 用数学模型(黑色的最佳拟合线)表示数据(彩色的线)的优势是什么?模型如何帮助人们更好地理解数据?

1.在代数方程y = Mx + B中,M和B代表什么?它们在每个图表下面的标签上指的是什么?字母R呢?(别担心 -- 有些人可能在代数课上知道M和B,但不知道R!)

1.检查Lake Ice and Temperature屏幕上每个图表下面的值:

    a. 在**ice duration**模型中(屏幕上方的图表):利用最佳拟合线的斜率(M)和y截距(B),确定该线的x截距。这个值在现实生活中代表什么?(请记住,这只是一个湖泊,但如果这些数据代表了一般湖泊,那么对气候变化的影响是什么?)

    b. 看一下**temperature**模型(屏幕下方的图表)。这条线的斜率(M)对每10年的气温上升意味着什么?那每100年呢?(同样,这张图表中的数据来自一个湖泊,数据点太少,无法一概而论。)

1.看看**Compare Lakes**屏幕上的冰期模型。Spirit Lake的坡度(M)与Gull Lake湖的坡度比较如何?是什么导致了这种差异呢?考虑到每个湖有不同的平均深度:

    * Spirit Lake,爱荷华州,平均深度2.3米

    * Gull Lake,密歇根州,平均深度11.6米

    * otsego Lake,纽约州,平均深度24.9米

    利用有限的例子,你能猜出为什么不同深度的湖泊有不同的冰期趋势吗?还有什么其他因素可以解释不同的趋势线?

5. 在Compare Lakes屏幕中检查相关系数(R)的两个值,然后查看彩色数据线与各自的黑色最佳拟合线的接近程度。

如果你学过统计学,你就会知道R为0意味着没有线性相关,而R为+1或-1意味着有完美的线性相关。

使用两个R值,哪个湖泊数据与线性模型的相关性更好?

(湖泊深度研究来源:Warne, c.p.k., McCann, k.s., Rooney, N., Cazelles, K., & Guzzo, m.m.(2020)。地理和形态影响着北半球湖泊的冰期动态。地球物理学报,36(4):893 - 893。https://doi.org/10.1029/2020GL087953。
Geography and morphology affect the ice duration dynamics of Northern Hemisphere lakes worldwide. Geophysical Research Letters, 47, e2020GL087953. https://doi.org/10.1029/2020GL087953)
页: [1]
查看完整版本: 【App Inventor数据可视化】使用电子表格和图表4:在App中添...