Git
git版本控制在日常开发中是必不可少的,虽然非科班出身,但是自己在博客的配置过程中也用过Git的版本控制功能,感觉还是非常棒的,所以这里就对Git的一些常用命令进行一个简单的记录,以后有机会了再深入学习这个好用的工具 命令 含义 git reset –hard 目标版本号 版本回退(一定记得加-hard不然不起作用!)
博客的公式渲染问题
第二次大的整顿Hexo博客,主要解决标签外挂公式排版等问题
魔改教程
借鉴大佬们的美化教程对博客进行魔改,一些比较基础的页面美化
遗传算法
当进化与选择的朴素观念在当代的前沿领域生根发芽,事情逐渐变得有趣起来。 Fitness calculation →Reproduction→Mutation→Fitness calculation 达尔文的进化论讲的是什么?在一个自然存在的生物种群中,生物生存的自然环境会对生物进行选择,在选择上存下来的个体有更大的机会去将自己的基因传递给下一代,传递过程中会发生基因的变异(mulate)和杂交(crossover)来保证基因在传递过程中的多样性和稳定性。 人们在进化论的启发下,设计出一种进化算法(Evolutionary Algorithms)。 通过对原始问题进行编码,首先初始化一个合适的可行方案集,然后通过建立适当的评估函数对所有的评估方案进行评估,虽然可能所有的评估方案距离期望达到的效果都比较差,但是可以在这这里边选择相对比较好的方案赋予他们在杂交过程中更大的优势,让那些效果比较好的可行方案有更大的概率进行杂交,同时在杂交的过程中进行一定程度的变异,对最终产生的结果进行新一轮的评价。 Genetic Algorithms.一般来说,只要我们建立合适的fitness fu ...
PageRank
聊一聊第一好用的浏览器搜索引擎谷歌背后的故事
Excel大法
记录一些Excel比较容易忘的一些骚操作,以后有机会再深入学习。 移动列:选中要移动的内容,按住Shift键然后将光标移动到待移动列的周围使得光标变成十字形状。 单元格批量相同值填充: 选中需要进行填充的单元格(比如常见的空白单元格),然后在一个单元格输入完成后不要直接敲回车键,而是敲Ctrl+Enter键,这样可以一次性填充多个单元格。
Pd实战
主要写一些平时看到的比较常用的一些pd的函数的应用,通过应用场景来辅助更好地理解pandas。 合并高度对称的列 在实际运用过程中,我们可能会拿到形如以下形式的数据: 这样的数据集存在几个列的内容完全一致,因此我们希望实现的一个功能就是将这几个列的值合成一个列,得到形如下图的数据形式: import pandas as pd df = pd.DataFrame({ '爱好1': {'小明': '睡觉', '小红': '弹琴'}, '地点1': {'小明': '床上', '小红': '家'}, '爱好2': { '小明': '骑马', '小红': '开车' }, '地点2': { '小明': '马场', '小红': '车上' } }) df #方法1 df[['爱好1', '地点1']].append(df[['爱好2', '地点2']].rename( columns={' ...
PyCaret
PyCaret是Python中的低代码机器学习开发平台,能够自动完成机器学习的整个工作流。 这个库提供了借助相对工整的数据(无缺失值、类型明确)对一类的机器学习模型(分类、回归、聚类)进行训练,该库能够自己对数据集进行处理,并且能够自动生成模型,除此以外还能进行模型的评价和在测试集上的训练,这些都可以在官方文档中的QuickStart中查看。 这个库非常好的一点在于可以直接根据输入数据来判断数据类型然后作相应的数据处理操作,除此以外它也支持自定义的数据处理操作,这些操作可以在官方文档中的Preprocessing中查看。 最后,这个库也支持对于某一个特定的模型进行调优,这些调优可以在官方文档中的Hyperparameter Tuning中查看。
参数优化
参数优化主要说的是机器学习模型的最优超参数的寻找问题。最基本的(也可能是众所周知的)替代方案是 sklearn 的 GridSearchCV,它将尝试多种超参数组合并根据交叉验证选择最佳组合。 Optuna会在定义的搜索空间中使用自己尝试的历史来确定接下来要尝试的值。它使用的方法是一种称为“Tree-structured Parzen Estimator”的贝叶斯优化算法。