个性化服务中用户兴趣模型研究_计算机理论论文十篇
个性化服务中用户兴趣模型研究_计算机理论论文十篇
【计算机论文】导语,大家眼前所阅览的此篇共有7928文字,由戚国小细致整理,发表在美文档!兴趣是个人力求接近、探索某种事物和从事某种活动的态度和倾向,亦称“爱好”,是个性倾向性的一种表现形式。兴趣在人的心理行为中具有重要作用。一个人对某事物感兴趣时,便对它产生特别的注意,对该事物观察敏锐、记忆牢固、思维活跃、情感深厚。个性化服务中用户兴趣模型研究_计算机理论论文十篇要是你对这文章有什么独特的建议,也可以上传分享给大家!
个性化推荐服务中用户兴趣模型研究_计算机理论论文 第一篇
我们用得到的用户浏览的n张网页组成一个矩阵,每张网页表示为:= 这样,用户浏览网页的特征矩阵就可表示为: 的每个行向量表示的是网页 ,下标m=max ( )。 这样的表示在一定程度上代表了用户的兴趣,但也仅仅表示的是网页内容给用户带来的兴趣,真正反应用户兴趣的还应加上用户的行为兴趣数据.在矩阵d上加上用户的行为数据。将用户浏览的页面内容和用户的行为结合起来,就得到了完整的用户兴趣度模型。这样,改进后的用户的兴趣浓度就可表示为: = bi。
基于遗传算法的高校排课系统研究_计算机理论论文 第二篇
(1)初始化 初始化的目的在于为后面的遗传操作提供初始种群。 在我们的算法中,由于每次对一位教师进行遗传操作,初始化时就需要考虑到教室及时间的设定,这其中包括教室可容人数的最优逼近(即避免一个30人的班级占用可容200人的教室这种情况),以及上课时间安排的合理性,这在排课问题描述中已有解释。 (2)选择[select] 选择运算用于模拟生物界去劣存优的自然选择现象。它从旧种群中选择出适应度高的某种染色体,放入配对集合中,为染色体交叉和变异运算产生新种群做准备。适应度越高的染色体被选择的可能性越大, 选择操作的方法有许多,如轮盘赌选择法(roulette wheel selection),局部选择法(local selection),锦标赛选择法(tournament selection)等。研究中,我们选用了局部选择法中的一种:截断选择法(truncation selection)。在截断选择法中,染色体按适应度函数值由高到低排序,只有最优秀的个体才能被选作父个体。其中,用于决定染色体被选作父个体的百分比的参数称为截断阀值trunc,其取值范围为50%~10%。在该阀值之外的个体不能产生子个体。算法中选择强度与截断阀值的关系如表1所示。表1 选择强度与截断阀值的关系[5]截断阀值1% 10% 20% 40% 50%80%选择强度2.66 1.76 1.2 0.97 0.80.34 其中选择强度是将正规高斯分布应用于选择方法,期望平均适应度。 选择强度表示为:selinttrunc(trunc) = 式中fc为下列高斯分布的积分下限:trunc = (3)交叉[crossover] 交叉是根据选择操作的结果,选取两条染色体作为父个体,再取一随机值(设为r)与系统预设的交叉率值(设为t)比较,若r
由适应值曲线图可以看出,该算法具有较好的收敛性,也说明了本文中提到的染色体编码方案和适应度函数能够较好地反映排课要求,染色体经过世代进化后可以得到令人满意的最优解。图3是利用遗传算法排出的01811,01812两个班级某个学期的课表,从课表中可以看出该课表不存在教师、教室、班级冲突,同一门课程两次上课时间间隔都达到一天以上,并且没有课程被安排在晚上,因此不管是硬约束条件还是软约束条件都得到较好的满足。
7 结论 本文论述了利用遗传算法求解高校课表的安排问题,实验证明文中提出的染色体编码方案和适应度函数是可行的,适应度函数值能够随着进化代数的增加而呈不断上升趋势,实验结果令人满意。在染色体编码方案方面,今后还准备考虑更复杂的课程安排要求。图3 基于遗传算法的排课结果示例参考文献 [1]业宁,梁作鹏,董逸生. 一种基于遗传算法的ttp问题求解算法. 东南大学学报(自然科学版).20xx(1):41-44 [2]唐 勇,唐雪飞,王 玲.基于遗传算法的排课系统. 计算机应用.20xx(1):93-94,97 [3]h.l.fang,”genetic algorithms in timetabling and scheng”,ph.d. thesis,department of artificial intelligence, university of edinburgh, uk,1994. [4] e.k. burke, d.g. elliman, r.f. weare, "a genetic algorithm based university timetabling system", east-west conference on computer technologies in education, crimea, ukraine, 1994, pp. 35-40. [5] 王小平,曹立明.遗传算法——理论、应用与软件实现.西安:西安交通大学出版社,20xx:31-33
个性化推荐服务中用户兴趣模型研究_计算机理论论文 第三篇
为了找到t,v与网页兴趣度的定量关系,通过和实验,决定采用一元线性回归方法作为网页兴趣建模的工具。线性回归方法是在研究对象变化趋势的基础上建立函数模型,从而研究对象之间存在的相互依存关系。 用户浏览行为和网页兴趣度之间的回归方程可建立为: d(p)=at+bv+c,其中,a,b,c是与t(p)和v(p)无关的未知参数,它们的估计可采用最小二乘法。这样通过该方程就可以计算用户对每个网页的行为兴趣度 bi (behavior interesting)。4 用户兴趣模型的表示
基于遗传算法的高校排课系统研究_计算机理论论文 第四篇
ga中首要考虑的是如何表现其问题,即如何对染色体编码,使之适用于ga操作。在经典的遗传算法中,常采用浮点数或二进制的编码方法,而研究中,每条染色体代表每位教师的课表,其结构表示如下:教师id班级id课程id教室上课时间安排 染色体在程序中可用十进制数编码,例如:某一教师编号为1247,要教授“数据库原理”这门课,“数据库原理”课程编号为8017,周学时为4,班级为01811、01812,随机产生上课时间,随机选择大于两班总人数的教室,则可生成染色体如:“124701811018128017024012241”其中02401,2241分别代表教室及上课时间星期二第二个教学单元(即上午3、4节)和星期四第一个教学单元(即上午1、2节)。 按如上编码,两条染色体对后9位作交叉操作,不会影响到每位教师所教授的课程,也不会造成教师课表内含其他教师的教授课程或每代演化后染色体结构不合理等问题。每一条染色体表示一种可能的排课结果,至于排课结果的优劣,则由适应度函数评估染色体的适应值来决定。适应度函数 遗传算法在进化中是以每个个体的适应度值为依据来选取下一代种群的。适应度函数设定的好坏直接影响到遗传算法的收敛速度和能否找到最优解。在本系统中,适应度函数的设计思想是对每条染色体中存在的冲突类型进行加权求和,其中权值wi代表的是第i条规则的重要程度,若某条染色体违反了某条规则i,则将其值pi置为1(若没有违反规则i,则pi值为0),其受到的惩罚值为wipi,对染色体中存在的冲突进行加权求和并加上1后,再求其倒数,如以下公式所示。染色体适应度函数值越大,则表示其拥有较好的授课时段和教室,其在下一代的演化中的生存概率就较大。
个性化推荐服务中用户兴趣模型研究_计算机理论论文 第五篇
从表面上看能揭示用户对网页p兴趣度d(p)的浏览行为很多,但我们发现,起关键作用的是两种行为:在网页p上的浏览时间t(p)(简称t行为)和翻页/拉动滚动条的次数v(p)(简称v行为)。 原因有三:1)查询、编辑、修改等行为必定增加网页浏览时间和翻页次数,因此能够通过后者间接的得到反映。2)执行了保存、标记书签等动作的页面,若真为用户关心,通常以后会被多次调出来重新浏览,故可体现为访问次数。3)点击鼠标动作不被考虑,因为简单动作不能有效揭示用户兴趣。
个性化推荐服务中用户兴趣模型研究_计算机理论论文 第六篇
采用向量空间模型表示的数据,必须选择计算两个特征矢量之间相似性的相似度函数。现在常用的方法有欧几里德距离、曼哈坦距离和夹角余弦函数。我们在这里采用夹角余弦函数。但是在计算时可能会遇到用于比较的两个特征矢量长度不一样,我们可以采用添零补齐的方法使两者长度一致。夹角余弦函数如下: 其中,c(x,y)表示页面x与y的相似度, 与 表示x与y对应的特征词的权值。页面x与y值越相似,c(x,y)值越大;反之则越小。3 基于浏览行为的用户兴趣 研究表明,用户很多浏览行为都能很好地反映用户的兴趣。文献指出用户的很多动作都能暗示用户的喜好,如查询、浏览页面和文章、标记书签、反馈信息、点击鼠标、拖动滚动条、前进、后退等。文献[7]的研究指出用户访问时的停留时问、访问次数、保存、编辑、修改等动作能够揭示用户兴趣。这些行为究竟怎样反映用户的兴趣,我们需要对其进行量化估算。
个性化推荐服务中用户兴趣模型研究_计算机理论论文 第七篇
与数据库中的结构化数据相比,web文档具有有限的结构,即使具有一些结构,也是着重于格式而非文档内容。此外,文档的内容是人类所使用的自然语言,计算机很难处理其语义。web 文本信息源的这些特殊性使得现有的数据挖掘技术无法直接应用于其上。这就需要对文本进行预处理,抽取代表其特征的元数据,作为文档的中间表示形式。 近年来应用较多且效果较好的特征表示法是向量空间模型(vector space modelv) 法。在v 中,将文本文档看成由一组词条 构成,对于每一词条 ,根据其在文章中的重要程度赋予一定的权重 。因此,所有用于挖掘的页面文档都可以用词条特征矢量 表示。要将文本表示为向量空间中的一个向量,就先要将文本分词,由这些特征词作为向量的维数来表示文本,最初的向量表示完全是0、l形式,即,如果文本中出现了该词,那么文本向量的该维为l,否则为0。这类方法无法体现这个词在文本中的作用程度,所以0、l逐渐被更精确的词频代替,词频分为绝对词频和相对词频。绝对词频,即使用词在文本中的出现频率表示文本;相对词频为规一化的词频,其计算方法主要运用tf-idf公式,目前存在多种tf-idf公式,我们可采用一种比较普遍的tf-ldf 公式: 我们把用于挖掘的页面文档作为一个文档集合。这样对于文档集合 d = 中的任一文档 ,采用向量空间模型表示为: = 其中m 为文档 特征向量的个数, 为文档 的第i个特征向量, 为文档 中 的权值。
个性化推荐服务中用户兴趣模型研究_计算机理论论文 第八篇
摘 要 本文提出了一种利用用户浏览页面集的内容信息和浏览行为信息,隐式地创建用户兴趣描述文件的方法。通过对用户浏览的web页面进行兴趣度,并与对用户浏览网页时的浏览行为相合,得到了用特征矩阵表示的用户兴趣模型。并采用层次聚类算法和 k-means 聚类算法相结合的综合聚类算法进行聚类,得到用兴趣分类树表示的用户兴趣模型。由于采用的是隐式创建用户描述文件的方法,减少了因用户参于而带来的系统噪声,保证了所创建的用户兴趣模型的准确性。 关键词 用户兴趣模型;浏览内容;浏览行为;兴趣分类树
人们正在寻求一种将用户感兴趣的信息主动推荐给用户,对不同的用户提供不同的服务策略和服务内容的服务模式,即个性化服务的信息方式 。 用户兴趣模型是个性化服务系统的关键部分,用户兴趣描述的准确与否直接决定着个性化推荐服务的质量好坏。本文提出了一种利用用户浏览页面集的内容信息和浏览行为信息,隐式地创建用户兴趣描述文件的方法。该方法以用户浏览web页面的内容信息和行为信息作为数据源,采用web挖掘方法得到较准确的用户兴趣描述,减少了由于用户参与而带来的系统噪声,保证了所创建的用户兴趣模型的准确性。1 基于web浏览内容和行为相结合的用户兴趣模型 整个用户兴趣模型的创建过程包括web浏览内容和web浏览行为两部分,流程图如图1所示。wWW.meiword.com图1 用户兴趣模型创建流程图 web浏览内容,就是采用web聚类方法对用户已浏览的web页面集进行内容聚类,得到用户感兴趣的页面集;web浏览行为是对用户浏览页面时的行为信息进行,得到用户对单一页面的兴趣浓度。将二者相结合,就得到了用户感兴趣的主题类别及对每类主题的兴趣度,即用兴趣分类树表示的用户兴趣模型2 基于web浏览内容的用户兴趣 本文中用户兴趣模型描述所基于的web浏览内容是指用户浏览页面的内容信息,它被用于基于内容的聚类。这些页面的内容信息主要来源于 web 服务器端,首先根据用户的浏览日志记录,得到单一用户的浏览历史页面 url,然后从数据库服务器中取出这些 url 对应的 web 页面,作为对浏览内容兴趣描述的数据源。
柱体表面缺陷区域面积自动检测系统的研究_计算机理论论文 第九篇
为了检测出缺陷的边缘,进行图像分割(缺陷子图像的提取),灰度分割阈值t的选择相当重要。在对图像进行了二值化,对于直方图双峰明显, 谷底较深的图像, 双峰法和迭代法,这两种方法可以较快地获得满意结果。双峰法实现简单, 要根据直方图特征设定一个合理的峰宽; 迭代法运算稳定, 但运算量大; 简单统计法避免了灰度直方图, 因此适应面广, 实现也很简单。但是对于直方图双峰不明显,或图像目标和背景比例差异悬殊, 此两种方法就不能完全提取出重要的信息,使处理出的图像效果都不是非常理想。最大类间方差法( otsu法)(对图像, 设t为前景与背景的二值化阈值, 前景点数占图像比例为w0, 平均灰度为u0; 背景点数占图像比例为w1, 平均灰度为u1。图像的总平均灰度为: u=w0u0+w1u1。从最小灰度值到最大灰度值遍历t, 当t使得值b=w0 (u0- u) 2+w1 (u1- u) 2最大时, t即为二值化的最佳阈值。对最大类间方差法可作如下理解: 该式实际上就是类间方差值, 阈值t二值化出的前景和背景两部分构成了整幅图像, 而前景取值u0, 概率为w0, 背景取值u1, 概率为w1, 总均值为u, 根据方差的定义即得该式。因方差是灰度分布均匀性的一种度量,方差值越大,说明构成图像的两部分差别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小, 因此使类间方差最大的二值化意味着错分概率最小。)处理出的图像边缘比较清晰, 算法也比较稳定。对于不同光照条件下得到的图像, 最大类间方差法处理出的图像边缘一致性最好, 重复性边缘定位基本可以控制在一个像素范围内。最大类间方差法致命的缺陷是当目标物与背景灰度差不明显时, 会出现无法忍受的大块黑域, 甚至会丢失整幅图像的信息。为了解决这个问题, 有人提出了灰度拉伸的增强最大类间方差法。这种方法的原理其实就是在最大类间方差法的基础上通过增加灰度的级数来增强前后景的灰度差, 从而解决问题。灰度增加的方法是用原有的灰度级乘上同一个系数,从而扩大灰度的级数, 选择一个比较合适的拉伸系数改进最大类间方差法后处理图像效果会更好, 因为图像的边缘会随着图像拉伸而变化, 不合适的拉伸系数会破坏图像的边缘。
柱体表面缺陷区域面积自动检测系统的研究_计算机理论论文 第十篇
图像采集卡的主要作用是对ccd摄像头采集到的图像进行a/d转换,然后输入到计算机中。本文采用的图像采集卡为天敏公司生产的sdk2000型采集卡,其主要性能指标为: 1) pci总线,兼容windows即插即用(pnp),安装简易。 2) 每秒可达30帧。 3) 显示分辨率可达640x480、24位真彩色。2 从透视图像到平行投影图像的转换 每个镜头都有一定的景深,在景深范围内的物体均能清晰地成像。因柱体表面为曲面,其上各点到摄像头的距离各不相同,此时ccd摄像头所拍摄到的图像是依据透视变换关系将三维物体通过镜头成像在ccd敏感面上的二维平面图像,这里笔者称其为透视图像。这里计算实际面积必须进行从透视图像到平行投影图的转换。其方法是: ⑴ 图像水平旋转校正,利用hough变换找到柱体的轮廓边缘的轮廓直线和标记直线,将其旋转校正至水平。 ⑵ 图像垂直移位,将柱体中轴与图像中心线重合。尽管图像已经水平,但在图像中的柱体部分或上或下偏移图像中心,这就需要将图像中的柱体部分移至图像,即图像中轴线与柱体中轴线重合。根据以标定的标尺和照片上标尺的实际大小可以确定相机至柱体的距离,可以算出柱体对应的角,又已知柱体半径,根据照相点和投影点的关系可以将圆柱体表面还原,再以圆柱中心对应等距离照相点投影到该面上的投影就是我们要求的。这就将柱体中轴与图像中心线重合。 ⑶ 图像垂直校正,将曲面图形转换成平面图像。求出脱粘面的边缘轮廓坐标,这样利用轮廓在中轴线上横坐标(以图中心为坐标原点)值i不变,垂直于中轴线上的纵坐标值j按照rasin(j/r));(r为柱体柱体半径),将缺陷面的轮廓还原成平面上的实际轮廓大小,利用matlab工具箱中的函数求出轮廓内的象素点的个数.3 图像预处理 柱体表面缺陷图ccd相机取出,记取在图像缓冲器上后,将灰度图像二值化,除去干扰,可进行缺陷轮廓提取。二值化以下的处理由计算机进行。以下,阐述图像的滤波、阈值的确定、缺陷轮廓提取及缺陷图像的复原。 3.1 在图像拍摄过程中,由于光照不均而造成的亮度不均会严重影响图像的二值化,从而使图像边缘轮廓部分丢失,因此需要针对亮度不均进行校正,以便正确地分离出边缘轮廓,运用同态滤波对亮度不均进行校正,运用同态滤波使图像的光照得到了整体上的抑制,并使目标与背景的对比度有所改善。
文章地址:www.myenblog.com/a/286087.html