第一章 算法初步 1.1.1 算法的概念 1、算法概念: 在数学上,现代意义上的“算法”通常是指可以用计算机来解决的某一类问题是程序或步骤,这些程序或步骤必须是明确和有效的,而且能够在有限步之内完成. 2. 算法的特点: (1)有限性:一个算法的步骤序列是有限的,必须在有限操作之后停止,不能是无限的. (2)确
关注公众号:diyijc_com
问题反馈
第一章 算法初步 1.1.1 算法的概念 1、算法概念: 在数学上,现代意义上的“算法”通常是指可以用计算机来解决的某一类问题是程序或步骤,这些程序或步骤必须是明确和有效的,而且能够在有限步之内完成. 2. 算法的特点: (1)有限性:一个算法的步骤序列是有限的,必须在有限操作之后停止,不能是无限的. (2)确定性:算法中的每一步应该是确定的并且能有效地执行且得到确定的结果,而不应当是模棱两可. (3)顺序性与正确性:算法从初始步骤开始,分为若干明确的步骤,每一个步骤只能有一个确定的后继步骤,前一步是后一步的前提,只有执行完前一步才能进行下一步,并且每一步都准确无误,才能完成问题. (4)不唯一性:求解某一个问题的解法不一定是唯一的,对于一个问题可以有不同的算法. (5)普遍性:很多具体的问题,都可以设计合理的算法去解决,如心算、计算器计算都要经过有限、事先设计好的步骤加以解决. 1.1.2 程序框图 1、程序框图基本概念: (一)程序构图的概念:程序框图又称流程图,是一种用规定的图形、指向线及文字说明来准确、直观地表示算法的图形。 一个程序框图包括以下几部分:表示相应操作的程序框;带箭头的流程线;程序框外必要文字说明。 (二)构成程序框的图形符号及其作用 程序框 名称 功能 起止框 表示一个算法的起始和结束,是任何流程图不可少的。 输入、输出框 表示一个算法输入和输出的信息,可用在算法中任何需要输入、输出的位置。 处理框 赋值、计算,算法中处理数据需要的算式、公式等分别写在不同的用以处理数据的处理框内。 判断框 判断某一条件是否成立,成立时在出口处标明“是”或“Y”;不成立时标明“否”或“N”。 学习这部分知识的时候,要掌握各个图形的形状、作用及使用规则,画程序框图的规则如下: 1、使用标准的图形符号。2、框图一般按从上到下、从左到右的方向画。3、除判断框外,大多数流程图符号只有一个进入点和一个退出点。判断框具有超过一个退出点的唯一符号。4、判断框分两大类,一类判断框“是”与“否”两分支的判断,而且有且仅有两个结果;另一类是多分支判断,有几种不同的结果。5、在图形符号内描述的语言要非常简练清楚。 (三)、算法的三种基本逻辑结构:顺序结构、条件结构、循环结构。 1、顺序结构:顺序结构是最简单的算法结构,语句与语句之间,框与框之间是按从上到下的顺序进行的,它是由若干个依次执行的处理步骤组成的,它是任何一个算法都离不开的一种基本算法结构。 顺序结构在程序框图中的体现就是用流程线将程序框自上而 下地连接起来,按顺序执行算法步骤。如在示意图中,A框和B 框是依次执行的,只有在执行完A框指定的操作后,才能接着执 行B框所指定的操作。 2、条件结构: 条件结构是指在算法中通过对条件的判断 根据条件是否成立而选择不同流向的算法结构。 条件P是否成立而选择执行A框或B框。无论P条件是否成立,只能执行A框或B框之一,不可能同时执行A框和B框,也不可能A框、B框都不执行。一个判断结构可以有多个判断框。 3、循环结构:在一些算法中,经常会出现从某处开始,按照一定条件,反复执行某一处理步骤的情况,这就是循环结构,反复执行的处理步骤为循环体,显然,循环结构中一定包含条件结构。循环结构又称重复结构,循环结构可细分为两类: (1)、一类是当型循环结构,如下左图所示,它的功能是当给定的条件P成立时,执行A框,A框执行完毕后,再判断条件P是否成立,如果仍然成立,再执行A框,如此反复执行A框,直到某一次条件P不成立为止,此时不再执行A框,离开循环结构。 (2)、另一类是直到型循环结构,如下右图所示,它的功能是先执行,然后判断给定的条件P是否成立,如果P仍然不成立,则继续执行A框,直到某一次给定的条件P成立为止,此时不再执行A框,离开循环结构。 当型循环结构 直到型循环结构 注意:1循环结构要在某个条件下终止循环,这就需要条件结构来判断。因此,循环结构中一定包含条件结构,但不允许“死循环”。2在循环结构中都有一个计数变量和累加变量。计数变量用于记录循环次数,累加变量用于输出结果。计数变量和累加变量一般是同步执行的,累加一次,计数一次。 1.2.1 输入、输出语句和赋值语句 1、输入语句 (1)输入语句的一般格式 (2)输入语句的作用是实现算法的输入信息功能;(3)“提示内容”提示用户输入什么样的信息,变量是指程序在运行时其值是可以变化的量;(4)输入语句要求输入的值只能是具体的常数,不能是函数、变量或表达式;(5)提示内容与变量之间用分号“;”隔开,若输入多个变量,变量与变量之间用逗号“,”隔开。 2、输出语句 (1)输出语句的一般格式 (2)输出语句的作用是实现算法的输出结果功能;(3)“提示内容”提示用户输入什么样的信息,表达式是指程序要输出的数据;(4)输出语句可以输出常量、变量或表达式的值以及字符。 3、赋值语句 (1)赋值语句的一般格式 (2)赋值语句的作用是将表达式所代表的值赋给变量;(3)赋值语句中的“=”称作赋值号,与数学中的等号的意义是不同的。赋值号的左右两边不能对换,它将赋值号右边的表达式的值赋给赋值号左边的变量;(4)赋值语句左边只能是变量名字,而不是表达式,右边表达式可以是一个数据、常量或算式;(5)对于一个变量可以多次赋值。 注意:①赋值号左边只能是变量名字,而不能是表达式。如:2=X是错误的。②赋值号左右不能对换。如“A=B”“B=A”的含义运行结果是不同的。③不能利用赋值语句进行代数式的演算。(如化简、因式分解、解方程等)④赋值号“=”与数学中的等号意义不同。 1.2.2条件语句 1、条件语句的一般格式有两种:(1)IF—THEN—ELSE语句;(2)IF—THEN语句。2、IF—THEN—ELSE语句 IF—THEN—ELSE语句的一般格式为图1,对应的程序框图为图2。 图1 图2 分析:在IF—THEN—ELSE语句中,“条件”表示判断的条件,“语句1”表示满足条件时执行的操作内容;“语句2”表示不满足条件时执行的操作内容;END IF表示条件语句的结束。计算机在执行时,首先对IF后的条件进行判断,如果条件符合,则执行THEN后面的语句1;若条件不符合,则执行ELSE后面的语句2。 3、IF—THEN语句 IF—THEN语句的一般格式为图3,对应的程序框图为图4。 注意:“条件”表示判断的条件;“语句”表示满足条件时执行的操作内容,条件不满足时,结束程序;END IF表示条件语句的结束。计算机在执行时首先对IF后的条件进行判断,如果条件符合就执行THEN后边的语句,若条件不符合则直接结束该条件语句,转而执行其它语句。 1.2.3循环语句 循环结构是由循环语句来实现的。对应于程序框图中的两种循环结构,一般程序设计语言中也有当型(WHILE型)和直到型(UNTIL型)两种语句结构。即WHILE语句和UNTIL语句。 1、WHILE语句 (1)WHILE语句的一般格式是 对应的程序框图是 (2)当计算机遇到WHILE语句时,先判断条件的真假,如果条件符合,就执行WHILE与WEND之间的循环体;然后再检查上述条件,如果条件仍符合,再次执行循环体,这个过程反复进行,直到某一次条件不符合为止。这时,计算机将不执行循环体,直接跳到WEND语句后,接着执行WEND之后的语句。因此,当型循环有时也称为“前测试型”循环。 2、UNTIL语句 (1)UNTIL语句的一般格式是 对应的程序框图是 (2)直到型循环又称为“后测试型”循环,从UNTIL型循环结构分析,计算机执行该语句时,先执行一次循环体,然后进行条件的判断,如果条件不满足,继续返回执行循环体,然后再进行条件的判断,这个过程反复进行,直到某一次条件满足时,不再执行循环体,跳到LOOP UNTIL语句后执行其他语句,是先执行循环体后进行条件判断的循环语句。 分析:当型循环与直到型循环的区别:(先由学生讨论再归纳) (1) 当型循环先判断后执行,直到型循环先执行后判断; 在WHILE语句中,是当条件满足时执行循环体,在UNTIL语句中,是当条件不满足时执行循环 1.3.1辗转相除法与更相减损术 1、辗转相除法。也叫欧几里德算法,用辗转相除法求最大公约数的步骤如下: (1):用较大的数m除以较小的数n得到一个商 和一个余数 ;(2):若 =0,则n为m,n的最大公约数;若 ≠0,则用除数n除以余数 得到一个商 和一个余数 ;(3):若 =0,则 为m,n的最大公约数;若 ≠0,则用除数 除以余数 得到一个商 和一个余数 ;…… 依次计算直至 =0,此时所得到的 即为所求的最大公约数。 2、更相减损术 我国早期也有求最大公约数问题的算法,就是更相减损术。在《九章算术》中有更相减损术求最大公约数的步骤:可半者半之,不可半者,副置分母•子之数,以少减多,更相减损,求其等也,以等数约之。 翻译为:(1):任意给出两个正数;判断它们是否都是偶数。若是,用2约简;若不是,执行第二步。(2):以较大的数减去较小的数,接着把较小的数与所得的差比较,并以大数减小数。继续这个操作,直到所得的数相等为止,则这个数(等数)就是所求的最大公约数。 例2 用更相减损术求98与63的最大公约数. 分析:(略) 3、辗转相除法与更相减损术的区别: (1)都是求最大公约数的方法,计算上辗转相除法以除法为主,更相减损术以减法为主,计算次数上辗转相除法计算次数相对较少,特别当两个数字大小区别较大时计算次数的区别较明显。 (2)从结果体现形式来看,辗转相除法体现结果是以相除余数为0则得到,而更相减损术则以减数与差相等而得到 1.3.2秦九韶算法与排序 1、秦九韶算法概念: f(x)=anxn+an-1xn-1+….+a1x+a0求值问题 f(x)=anxn+an-1xn-1+….+a1x+a0=( anxn-1+an-1xn-2+….+a1)x+a0 =(( anxn-2+an-1xn-3+….+a2)x+a1)x+a0 =......=(...( anx+an-1)x+an-2)x+...+a1)x+a0 求多项式的值时,首先计算最内层括号内依次多项式的值,即v1=anx+an-1 然后由内向外逐层计算一次多项式的值,即 v2=v1x+an-2 v3=v2x+an-3 ...... vn=vn-1x+a0 这样,把n次多项式的求值问题转化成求n个一次多项式的值的问题。 2、两种排序方法:直接插入排序和冒泡排序 1、直接插入排序 基本思想:插入排序的思想就是读一个,排一个。将第1个数放入数组的第1个元素中,以后读入的数与已存入数组的数进行比较,确定它在从大到小的排列中应处的位置.将该位置以及以后的元素向后推移一个位置,将读入的新数填入空出的位置中.(由于算法简单,可以举例说明) 2、冒泡排序 基本思想:依次比较相邻的两个数,把大的放前面,小的放后面.即首先比较第1个数和第2个数,大数放前,小数放后.然后比较第2个数和第3个数......直到比较最后两个数.第一趟结束,最小的一定沉到最后.重复上过程,仍从第1个数开始,到最后第2个数...... 由于在排序过程中总是大数往前,小数往后,相当气泡上升,所以叫冒泡排序. 1.3.3进位制 1、概念:进位制是一种记数方式,用有限的数字在不同的位置表示不同的数值。可使用数字符号的个数称为基数,基数为n,即可称n进位制,简称n进制。现在最常用的是十进制,通常使用10个阿拉伯数字0-9进行记数。对于任何一个数,我们可以用不同的进位制来表示。比如:十进数57,可以用二进制表示为111001,也可以用八进制表示为71、用十六进制表示为39,它们所代表的数值都是一样的。 一般地,若k是一个大于一的整数,那么以k为基数的k进制可以表示为: , 而表示各种进位制数一般在数字右下脚加注来表示,如111001(2)表示二进制数,34(5)表示5进制数 第二章 统计 2.1.1简单随机抽样 1.总体和样本 在统计学中 , 把研究对象的全体叫做总体. 把每个研究对象叫做个体. 把总体中个体的总数叫做总体容量. 为了研究总体 的有关性质,一般从总体中随机抽取一部分: , , , 研究,我们称它为样本.其中个体的个数称为样本容量. 2.简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随 机地抽取调查单位。特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。 3.简单随机抽样常用的方法: (1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。 在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。 4.抽签法: (1)给调查对象群体中的每一个对象编号; (2)准备抽签的工具,实施抽签 (3)对样本中的每一个个体进行测量或调查 例:请调查你所在的学校的学生做喜欢的体育活动情况。 5.随机数表法: 例:利用随机数表在所在的班级中抽取10位同学参加某项活动。 2.1.2系统抽样 1.系统抽样(等距抽样或机械抽样): 把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。 K(抽样距离)=N(总体规模)/n(样本规模) 前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。 2.系统抽样,即等距抽样是实际中最为常用的抽样方法之一。因为它对抽样框的要求较低,实施也比较简单。更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。 2.1.3分层抽样 1.分层抽样(类型抽样): 先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。 两种方法: 1.先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。 2.先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。 2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。 分层标准: (1)以调查所要分析和研究的主要变量或相关的变量作为分层的标准。 (2)以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。 (3)以那些有明显分层区分的变量作为分层变量。 3.分层的比例问题: (1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。 (2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。 2.2.2用样本的数字特征估计总体的数字特征 1、本均值: 2、.样本标准差: 3.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。 虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。 4.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变 (2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍 (3)一组数据中的最大值和最小值对标准差的影响,区间 的应用; “去掉一个最高分,去掉一个最低分”中的科学道理 2.3.2两个变量的线性相关 1、概念: (1)回归直线方程 (2)回归系数 2.最小二乘法 3.直线回归方程的应用 (1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系 (2)利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计,即可得到个体Y值的容许区间。 (3)利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控制的目标。如已经得到了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度。 4.应用直线回归的注意事项 (1)做回归分析要有实际意义; (2)回归分析前,最好先作出散点图; (3)回归直线不要外延。 第三章 概 率 3.1.1 —3.1.2随机事件的概率及概率的意义 1、基本概念: (1)必然事件:在条件S下,一定会发生的事件,叫相对于条件S的必然事件; (2)不可能事件:在条件S下,一定不会发生的事件,叫相对于条件S的不可能事件; (3)确定事件:必然事件和不可能事件统称为相对于条件S的确定事件; (4)随机事件:在条件S下可能发生也可能不发生的事件,叫相对于条件S的随机事件; (5)频数与频率:在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数nA为事件A出现的频数;称事件A出现的比例fn(A)= 为事件A出现的概率:对于给定的随机事件A,如果随着试验次数的增加,事件A发生的频率fn(A)稳定在某个常数上,把这个常数记作P(A),称为事件A的概率。 (6)频率与概率的区别与联系:随机事件的频率,指此事件发生的次数nA与试验总次数n的比值 ,它具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增多,这种摆动幅度越来越小。我们把这个常数叫做随机事件的概率,概率从数量上反映了随机事件发生的可能性的大小。频率在大量重复试验的前提下可以近似地作为这个事件的概率 3.1.3 概率的基本性质 1、基本概念: (1)事件的包含、并事件、交事件、相等事件 (2)若A∩B为不可能事件,即A∩B=ф,那么称事件A与事件B互斥; (3)若A∩B为不可能事件,A∪B为必然事件,那么称事件A与事件B互为对立事件; (4)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);若事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B) 2、概率的基本性质: 1)必然事件概率为1,不可能事件概率为0,因此0≤P(A)≤1; 2)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B); 3)若事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B); 4)互斥事件与对立事件的区别与联系,互斥事件是指事件A与事件B在一次试验中不会同时发生,其具体包括三种不同的情形:(1)事件A发生且事件B不发生;(2)事件A不发生且事件B发生;(3)事件A与事件B同时不发生,而对立事件是指事件A 与事件B有且仅有一个发生,其包括两种情形;(1)事件A发生B不发生;(2)事件B发生事件A不发生,对立事件互斥事件的特殊情形。 3.2.1 —3.2.2古典概型及随机数的产生 1、(1)古典概型的使用条件:试验结果的有限性和所有结果的等可能性。 (2)古典概型的解题步骤; ①求出总的基本事件数; ②求出事件A所包含的基本事件数,然后利用公式P(A)= 3.3.1—3.3.2几何概型及均匀随机数的产生 1、基本概念: (1)几何概率模型:如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型; (2)几何概型的概率公式: P(A)= ; (3)几何概型的特点:1)试验中所有可能出现的结果(基本事件)有无限多个;2)每个基本事件出现的可能性相等.
更新时间:2016-03-25 10:15