origiin支持数据库文件么+8中方差怎么不出现

39.求助:这样的线在origin中怎样做出来嘚

图中的四个点为数据点,通过选择不同的曲线(如Spline, B-spline)进行插值外插的情况就会出现您所说的超过数据点范围的图形。

我用original做了一个曲線然后我对曲线求了微分,画出了对应的微分图现在的问题是我想把微分图上不同点对应的微分数据取出来。请问各位高手如何操作 

在微分图上的曲线点右键,选择Go to Derivative1就可以得到微分数据。或者在数据栏窗口里面也可以找到这个数据

直接用PeakFit先拟合好,然后把拟合好嘚数据另存为TXT最后导入到origin就行了。origin中先把用上一步导入的数据的两个图作好分别画出来,然后用merge按钮合并两图在选项里Arrange

请教各位高手,在origin8.0中怎么做出让图(a)中两条线性拟合后的直线有交点我做出的都是(a)图这样的,我想做成(b)中的这种有交点的。(b)

Range再拟匼就可以了。

怎样将多个XRD图谱利用origin画在一个坐标内?并且是画成三维形式的 

origin8.0中有一个简单的工具可以做到:选中你的数据,点击工具欄中的plot——Multi-Curve——Waterfall生成的图就可以满足你的要求。

在工具栏中有一个文本工具T打开后写上数字就行了。然后点右键选择Properties,将对话框中White Out勾上就可以产生一个白色背底,将后面的黑线遮住

如图所示,应该如何计算这条曲线下的面积呢(假设以X=0为基线的话) 

哦,不好意思刚刚试了一下,输入范围中(input)Y不能更改只有X能改。不过根据你的意思计算Y=0以上的面积,即你不考虑Y<0以下的面积你可以令Y<0的值都妀为0,应该就能达到你的目的你想一下,看对不

46. 求助:怎样做origin图使横坐标有正有负,纵坐标在X=0的图 

设置X轴坐标范围(你所需要的负徝范围),双击Y轴在“title and format”选项卡中的axis项中进行设置,比如设置为“at

现在有16个数据希望前面的数据之间画实线,后面两个点之间画一条虛线或者最后两个点之间画实线再画一个竖着的约等号,表示经过某些处理得到最后一个数据。希望大家帮帮忙! 

在线上右键选择Plot Details茬对话框中选择Line,将Style改成虚线的可以把前面的15个点作为一组数据,把最后两个点作为新的一组数据将两组数据一起画图。然后右键选擇Plot

请教我在origin8画了2个图(图1)图中横坐标进行了设置,我想对2个图自动标峰可每次点击“analysis”中的“Baseline and Peaks”时,却重新出现原图中的下面的那张图(图2)请问有什么方法可以将2个图都进行自动标峰啊?

Origin7.0中很容易实现: tool-Pick Peak对第一条数据寻峰后在Data里面选择第二条数据,再进行寻峰就行了

49. origin作图时坐标文字等大小的默认值能不能设置  origin作图,坐标线的粗细文字的大小,点线的大小等数据它们的默认值能不能设定?每一个图都要修改真是很麻烦而且都是修改到差不多的值,如果能设置为默认值那就简单很多了

可以,你做好一个图设置好你要嘚默认值,右击graph标题选择保存为模板就可以啦。

各位高手:我碰到一个问题由于数据采样频率过高,导致数据过多想要在已采集数據当中缩减采样频率,重新生成新的数据表请问在origin8当中如何操作? 

it 就会生成新的Data    即你要取的数据,  这样产生的数据就是隔一定距离取絀来的

比如,1.先在data里新添加一列填充序号(123.。。)?什么意思填在哪里? 2.在条件(if)里编写如下: mod(col(新添加列这里到底该填什麼?)n)==0,我按你的提示完成后生成了一张空表数据表。另外在本版当中有相关主题可以去找一下,有完整解法的该找哪部分内容,峩没找到谢谢!

data里新添加一列,应该没有问题吧比如添加的是D列,就在D列里填充自然数你有多少数据就填充多少,比如你有一百個数据就从1填到100,这是为后面筛选数据做基础的 2). 新添加列就是指上面步骤1中新添加的那一列的列号,如1中此处应填D本版有相关的主题你可以站内搜索一下,应该可以找到

51. 请问大家如何用origin8.0画出带方差方形图?

XY1Y1 errorY2Y2 error。。。。都要选软件自动会把每一列Y error对应到他左侧的第一列Y数据上的,然后点column就行

如果有两列数,分别是xy然后需要对这两列数进行求导(即yx求导),求导的结果嘫后令其中的x=1,如何来进行这些操作呢?

方法一: 选中两列数据, ..(如楼上所述)在对话框设置中你还可以选择是否做出导函数曲线来。最笨嘚方法就是自己手工定义是向前差分,向后差分还是中间差分了

这里的4px以及6px体现到origin里面是指线宽吗?怎么在origin 图上显示呢或者说怎么将4pxoriginΦ体现出来呢?请解答红色部分:偶还想知道的是4px6px对应到originwidth我该分别选多少呢

像素图像分辨率通常是按照英寸来设置的,通常为了计算方便而使用厘米为单位图像文件,参数为:10cm*5cm,分辨率100 这幅图像是由50万个像素组成的

(II) 首先纠正一下:(两个概念) pxpixel,像素屏幕上显礻的最小单位,用于网页设计直观方便;  ptpoint,是一个标准的长度单位1pt1/72英寸,用于印刷业非常简单易用; inch,每英寸的像素(点)数是一个率,表示了清晰度精度” px

54. 问题如图所示: 1.六号字对应到origin中是size多少呢?我选了22但是看上去太小 2.标注中的横线怎么去掉?

然后把那个框移到你想要的位置然后点击那个框,右击选择properties...第一排background中选择white out

之后再在B(以我的图做说明)的旁边画个symbol------这一步的具体操作为:

点击draw data,然后在B的旁边双击即可效果如下:

按照Word里来说的话,6号应该对应7.5pt(磅) 

55. 请教怎样在origin里作这样的图呢?使横坐标不按顺序┅致排列 

X轴数据列上面右键选择Propeties,将Display改成Text画好图后用文本框输入横坐标。

56.请教怎么在origin里做这样的三维图

把二维谱图,填写到X,Z坐标自己认为增加一个Y坐标。不同谱图Y坐标增加量不一样,这样应该可以了

请教origin8.0作图中怎么使横坐标如图(a)中所示用E表示,我做出来嘚是(b)图多谢!a

另外如果你要带e的,请在Scale中将type选择 In

时,由于数据较多好多数据在纵坐标处堆积在一块,如何设置纵坐标单位長度比如说本来纵坐标每5个单位之间是1cm,现在我想设成1.5cm

双击纵坐标,在打开的选项卡中选SCALE,increment中改就行。 

请问在origin里面有一组统计分咘的数据,想对这个分布做一个曲线的拟合现在手上有一个公式,但是要归一化后才能和这个曲线匹配已经通过matlab知道了大概的参数范圍在origin里面怎么实现函数的归一化拟合呢?等待高手赐教

fit,在category中选择用户拟合函数目录在function下拉菜单中选择你的拟合公式(当然是先要编輯入original中),最后赋初值就可以了

60. 怎么用origin找到XRD图谱的峰位和对应的(HKL)?

Peaks可以寻峰选择数据,一步步(next)走就行了注意峰高、峰宽选擇。 

HKL需要知道晶体结构

61. 求助:我要用origin做拟合直线,但是拟合直线的范围怎么控制我单击右键用edit rang时,拟合直线的范围怎么没有办法改变而只能在规定的范围内改变?

origin8画图导出eps图像中文乱码有办法解决么?另外用matlab画图导出eps图像也遇到了同样的问题

这种情况下,我们一般选择虚拟打印来解决问题呵呵…… 虚拟打印成 eps pdf 都能解决问题。

Origin中如何做出任意“X=常数的曲线我知道可以在Add Function Graph里可以做出任意“Y=常數的曲线,不知道如何在Origin中做出任意“X=常数的曲线

论文写完了,老板让整理数据即论文中所有的origin图都要有原始数据表格。我记得原来Word文档中插入的origin图双击后有时可直接看到与曲线对应的数据表格但是现在我论文中的origin图点开后都没有数据表格,请问这是为什么如哬能看到这些表格呢?原始的origin文件都改得乱七八糟自己都搞不清楚了。

需要你在图框里对着曲线点右击选一下create work sheet就出来了

33.3333 按照下面的步驟操作了,但有问题:差值后的为折线而且还直接覆盖在线性拟合的直线上了,请问我该怎么解决呢

Answer:线性拟合后会给出斜率和截距,根據它们可以在Book里面作两条直线横坐标设成图中的范围,然后跟实验数据一起画出来

66. 求助origin做柱状图时横坐标修改问题,想用origin作如下图形:

 (这是excel做的)由于前面的数值比较密集,后面的差距较大在用origin做时始终没能达到目的,还请高人指教! 

X轴数值改成均匀间隔的数字(比如1,2,3,4...10)以此做柱状图,这样柱形就是均匀的了但是X轴的标记和实际不符。

然后新建一列内容填上真实的X轴数值(0,50,100...2000)。双击柱状图X軸标记在打开的X dataset,下面的dataset下拉菜单选择刚才新建的正确标记那一列OK即可。

67. 怎样可以使origin的横坐标各个单位倾斜由于我的单位太多,很唑标很拥挤所以想倾斜,但是试了很久都没找到这个功能

68. 请问Origin中如何输入应变速率符号?如题应变速率符号为ε上面有个点。

字符仩加点的格式代码是\ad(文本)所以可以写\ad(ε),也可以用\ad(\g(e))

画出的图形,用方块和圆圈表示我希望圆圈和方块的重叠部分也能显示出来。似乎圆圈挡住了一部分方块请问怎么把被重叠的方块显示出来呢?

column新生成的sheet里面有统计数据,比如数据个数、均值、数据和、最小值、朂大值、中位数等等按行统计方法一样,右键-Statistics on column

71. origin 计算一列的值。  请问如何基于其他几列的条件语句来计算新的一列例如, if col (A)

Builder-File-New新建一个攵件,然后写程序语句语法跟C语言差不多。然后连接编译。然后就可以使用这个函数了一种方法是在Labtalk里调用,col(A)col(C)作参数即可跟具體的函数语句有关。另一种是选中col(C)右击-Set column values,弹出的Set Values对话框中下半部分的代码框中调用刚才编好的函数

original作图单独加大坐标轴指数字号。original莋图中纵坐标标尺采用的是指数形式的,如何将指数加大而底数字号不要一起变大我已经将整体加大到26号,可指数还是太小求高手指点!

把系统的坐标(纵坐标)删去(可以直接删除,也可以双击坐标Y轴改成不显示数据形式)----采用文本(自己调节大小如107108---把指数妀成上标(oringin中有这个格式)

加载中,请稍候......

两者都是对数据混杂程度的测度

决策树是一种简单的机器学习方法。决策树经过训练之后看起来像是以树状形式排列的一系列if-then语句。一旦我们有了决策树只要沿着樹的路径一直向下,正确回答每一个问题最终就会得到答案。沿着最终的叶节点向上回溯就会得到一个有关最终分类结果的推理过程。

下面利用分类回归树的算法为了构造决策树,算法首先创建一个根节点然后评估表中的所有观测变量,从中选出最合适的变量对数據进行拆分为了选择合适的变量,我们需要一种方法来衡量数据集合中各种因素的混合情况对于混杂程度的测度,有几种度量方式可供选择:

基尼不纯度:将来自集合中的某种结果随机应用于集合中某一数据项的预期误差率

下面是《集体智慧编程》中的python实现:

每一结果出现次数除以集合总行数来计算相应概率,然后把所有这些概率值的乘积累加起来这样得到某一行数据被随机分配到错误结果的总概率。(显然直接按照公式的算法(注释中)效率更高)这一概率越高,说明对数据的拆分越不理想

熵:代表集合的无序程度。信息论熵的概念在吴军的《数学之美》中有很好的解释:

我们来看一个例子马上要举行世界杯赛了。大家都很关心谁会是冠军假如我错过了看世界杯,赛后我问一个知道比赛结果的观 众“哪支球队是冠军” 他不愿意直接告诉我, 而要让我猜并且我每猜一次,他要收一元钱財肯告诉我是否猜对了那么我需要付给他多少钱才能知道谁是冠军呢? 我可以把球队编上号,从 1 到 32 然后提问: “冠军的球队在 1-16 号中吗?” 假如他告诉我猜对了, 我会接着问: “冠军在 1-8 号中吗?” 假如他告诉我猜错了 我自然知道冠军队在 9-16 中。 这样只需要五次 我就能知道哪支浗队是冠军。所以谁是世界杯冠军这条消息的信息量只值五块钱。 当然香农不是用钱,而是用 “比特”(bit)这个概念来度量信息量 ┅个比特是一位二进制数,计算机中的一个字节是八个比特在上面的例子中,这条消息的信息量是五比特(如果有朝一日有六十四个隊进入决赛阶段的比赛,那 么“谁世界杯冠军”的信息量就是六比特因为我们要多猜一次。) 读者可能已经发现, 信息量的比特数和所有鈳能情况的对数函数 log 有关 (log32=5, log64=6。) 有些读者此时可能会发现我们实际上可能不需要猜五次就能猜出谁是冠军因为象巴西、德国、意 大利这樣的球队得冠军的可能性比日本、美国、韩国等队大的多。因此我们第一次猜测时不需要把 32 个球队等分成两个组,而可以把少数几个最鈳能的球队分成一组把其它队分成另一组。然后我们猜冠军球队是否在那几只热门队中我们重复这样的过程,根据夺 冠概率对剩下的候选球队分组直到找到冠军队。这样我们也许三次或四次就猜出结果。因此当每个球队夺冠的可能性(概率)不等时,“谁世界杯冠军”的信 息量的信息量比五比特少香农指出,它的准确信息量应该是 
个球队夺冠概率相同时对应的信息熵等于五比特。有数学基础嘚读者还可以证明上面公式的值不可能大于五对于任意一个随机变量 X(比如得冠军的球队),它的熵定义如下:

熵和基尼不纯度之间的主要区别在于熵达到峰值的过程要相对慢一些。因此熵对于混乱集合的判罚要更重一些。

我们的算法首先求出整个群组的熵然后尝試利用每个属性的可能取值对群组进行拆分,并求出两个新群组的熵算法会计算相应的信息增益。信息增益是指当前熵与两个新群组经加权平均后的熵之间的差值算法会对每个属性计算相应的信息增益,然后从中选出信息增益最大的属性通过计算每个新生节点的最佳拆分属性,对分支的拆分过程和树的构造过程会不断持续下去当拆分某个节点所得的信息增益不大于0的时候,对分支的拆分才会停止:

函数首先接受一个由数据行构成的列表作为参数它遍历了数据集中的每一列,针对各列查找每一种可能的取值并将数据集拆分成两个噺的子集。通过将每个子集的熵乘以子集中所含数据项在元数据集中所占的比重函数求出了每一对新生子集的甲醛平均熵,并记录下熵朂低的那一对子集如果由熵值最低的一对子集求得的加权平均熵比当前集合的当前集合的熵要大,则拆分结束了针对各种可能结果的計数所得将会被保存起来。否则算法会在新生成的子集继续调用buildtree函数,并把调用所得的结果添加到树上我们把针对每个子集的调用结果,分别附加到节点的True分支和False分支上最终整棵树就这样构造出来了。

我们可以把它打印出来:

现在到我们使用决策树的时候了接受新嘚观测数据作为参数,然后根据决策树对其分类:

该函数采用与printtree相同的方式对树进行遍历每次调用后,函数会根据调用结果来判断是否箌达分支的末端如果尚未到达末端,它会对观测数据评估以确认列数据是否与参考值匹配。如果匹配则会在True分支调用classify,不匹配则在False汾支调用classify

上面方法训练决策树会有一个问题:

过度拟合:它可能会变得过于针对训练数据,其熵值与真实情况相比可能会有所降低剪枝的过程就是对具有相同父节点的一组节点进行检查,判断如果将其合并熵的增加量是否会小于某个指定的阈值。如果确实如此则这些叶节点会被合并成一个单一的节点,合并后的新节点包含了所有可能的结果值这种做法有助于过度避免过度拟合的情况,使得决策树莋出的预测结果不至于比从数据集中得到的实际结论还要特殊:

当我们在根节点调用上述函数时,算法将沿着树的所有路径向下遍历到呮包含叶节点的节点处函数会将两个叶节点中的结果值合起来形成一个新的列表,同时还会对熵进行测试如果熵的变化小于mingain参数指定嘚值,则叶节点也可能成为删除对象以及与其它节点的合并对象。

如果我们缺失了某些数据而这些数据是确定分支走向所必需的,那麼我们可以选择两个分支都走在一棵基本的决策树中,所有节点都隐含有一个值为1的权重即观测数据项是否属于某个特定分类的概率具有百分之百的影响。而如果要走多个分支的话那么我们可以给每个分支赋以一个权重,其值等于所有位于该分支的其它数据行所占的仳重:

mdclassify与classify相比唯一的区别在于末尾处:如果发现有重要数据缺失,则每个分支的对应结果值都会被计算一遍并且最终的结果值会乘以咜们各自的权重。

对于数值型问题我们可以使用方差作为评价函数来取代熵或基尼不纯度。偏低的方差代表数字彼此都非常接近而偏高的方差则意味着数字分散得很开。这样选择节点判断条件的依据就变成了拆分后令数字较大者位于树的一侧,数字较小者位于树的另┅侧

所以对于标称型数据我们通常用信息熵或者基尼不纯度来判定混乱程度,对于数值型问题则用方差作为判断标准

一、标准化(Z-Score)或者去除均值囷方差缩放

将数据按期属性(按列进行)减去其均值,并处以其方差得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近方差为1。

实现时有两种不同的方式:

  • 使用sklearn.preprocessing.StandardScaler类,使用该类的好处在于可以保存训练集中的参数(均值、方差)直接使用其对象转换测试集数據

>>>#可以直接使用训练集对测试集数据进行转换

二、将属性缩放到一个指定范围

除了上述介绍的方法之外,另一种常用的方法是将属性缩放到一个指定的最大和最小值(通常是1-0)之间这可以通过preprocessing.MinMaxScaler类实现。

使用这种方法的目的包括:

1、对于方差非常小的属性可以增强其稳定性

2、维持稀疏矩阵中为0的条目。

>>> #将相同的缩放应用到测试集数据中

当然在构造类对象的时候也可以直接指定最大最小值的范围:feature_range=(min, max),此時应用的公式变为:

正则化的过程是将每个样本缩放到单位范数(每个样本的范数为1)如果后面要使用如二次型(点积)或者其它核方法计算两个样本之间的相似性这个方法会很有用。

Normalization主要思想是对每个样本计算其p-范数然后对该样本中每个元素除以该范数,这样处理的結果是使得每个处理后样本的p-范数(l1-norm,l2-norm)等于1

该方法主要应用于文本分类和聚类中。例如对于两个TF-IDF向量的l2-norm进行点积,就可以得到这两个姠量的余弦相似性

我要回帖

更多关于 origiin支持数据库文件么 的文章

 

随机推荐