你的位置:首页 > 数据库

[数据库]高维度下的数据科学—线性空间(上)

使得集合Y的元素和集合X的元素相对应起来的规则f。

广义的概念:

电影票也是一种映射,发工资也是一种映射,男女朋友也是映射。只要有对应关系,我么就可以认为是映射。映射这个概念就是发明用来对自然界和社会上对应关系的一种抽象。

非常需要注意的是:一定要记住:映射的概念是非常广泛的一个概念,任何两种有关系的事物都可以用映射的概念进行描述,比如张三映射到高三一班,高纬度向量映射到低维度空间。

映射与线性空间的概念对于数据科学来说至关重要,因为现实世界的数据总是包含着许许多多的维度。因此线性空间这个数学工具从某种程度上来说简直就是为数据科学而天造地设的。

X映射到Y上得到的Y上的值就是X映射成为的像

例如X为全班男生,而其中某一个男生的女朋友便是他的像

值域与定义域

X的取值域为定义域

X在Y上的像的取值域为值域

单射与满射

以男生映射到女生为男女关系为例

1.当映射的值域与Y相等时,称映射为满射

即所有的女生都有男朋友,那么就是满射了

2.不同的X不能映射到同一个Y上,这种映射被称为单射

如果有某个女生脚踩两条船,有两三个男朋友,那毫无疑问就不是单射了

3.当映射f即是单射又是满射的话,我们就称映射为一一映射或者双射

即所有的男生都只有一个女朋友,所有的女生也只有一个男朋友

线性映射

 

从向量说起

对于平面R(2)中的任意向量,其加法运算和数乘运算的定义已经是清楚的了,这里不再赘述,这两种运算是封闭的,即运算后的结果仍然在R(2)中,而且这两种运算满足以下八条运算规律。

线性空间的概念

由线性代数的知识,二维空间可以推广到n维空间,因此我们将上述的情况推至n维实向量空间(注意向量空间和线性空间的区别),可以知道n维向量空间中的向量也是满足上述一些运算率的。

由于实向量空间这种普遍性的性质,我们想为其定义一个专门的名字。于是就有了线性空间的定义。注:但线性空间的概念是要比实向量空间更为大的。

线性空间定义: 如果对于非空集合的元素,加法和数乘两种运算是封闭的,而且其元素的运算规律满足上述八条运算规律,那么我们称集合为数域F上的线性空间或者说向量空间(数域是集合中最最基本元素的取值域)。

线性空间的基本性质

线性空间的基(Basis)、坐标(coordinate)和维数(Dimension)

:如果线性空间中有一组向量线性无关,并且线性空间中任意向量都能够表示成这一组向量的线性组合,那么就称这一组向量为线性空间的基。

由基的定义可以看出,线性空间有无数个基——任意一个基,只要对其内部的某一向量乘以一个常数,变成一个新的向量,取代掉其本身,那么这组新的向量仍然是线性空间的基。

坐标: 线性空间中的任意向量都能够由基向量的线性组合表示出来,其线性组合的参数便为该向量相对于基的坐标。

维数:基中向量的个数,便为线性空间的维数。

注意:线性空间中向量的维数,并不见得是线性空间的维数。如下图中,x1与x2组成的线性空间只是二维,但是x1与x2却是3维向量。线性空间的维数,取决于其任意一个基中所包含的向量的个数。

关于线性空间的基的几点说明

1.如果把线性空间看做是无数个向量组成的向量组,那么线性空间的基就是向量组的最大无关组,线性空间的维数就是向量组的秩序。(例如上图中x1,x2两个向量所张成的线性空间的所有向量的组成的向量组的秩,毫无疑问是2)

2.如果a1,a2…an是线性空间V的一个基,线性空间可以写成span{a1,a2,…an}

3.对于线性空间中的任意一个线性无关组,如果其个数与基相等,那么这个线性无关组也是一个基

4.研究n维向量空间V,通过它的基及向量坐标表示,就转化为研究线性空间R^n

默认的基

事实上,在线性空间R^n中,我们日常的3维坐标,是有一个默认的基的,它就是n*n的单位矩阵。一定要记住坐标与向量并不是同一回事儿。

线性空间的子空间

定义:1.子空间是线性空间的一个子集,子空间的基的维数要比母空间的基的维数要小;2.子空间要满足加法和数乘运算的封闭性,以及8条运算规律,所以子空间必须包含原点。

基变换与坐标变换

对于不同的基,线性空间上的向量的坐标当然是不一样的,那么两种坐标应当如何进行变换呢?

基变换

坐标变换

证明很简单,将基向量组与坐标相乘,不同的基与其对应的坐标相乘,两个基与坐标相乘的结果是一样的。都是该向量的值。