包含标签 python 的文章

手把手用python在实现随机森林算法

是时候写写各机器学习的内容了。在google等搜索引擎越来越强大和越来越廉价的阿里云等云服务之后,越来越多的人能够有机会实现机器学习和人工智能相关的应用了。任何能够使用笔记本电脑并且乐于学习新知识的人都可以在几分钟内尝试最新的算法。再稍微多花一点时间,您就可以开发实用的模型来帮助您的日常生活或工作(甚至切换到机器学习领域并获得经济利益))。这篇文章将引导您完成功能强大的随机森林机器学习模型的手把手实现。它旨在补充我对随机森林的概念性解释,但只要您对决策树和随机森林有基本了解,就可以完全阅读。后续我们将讲述如何改善在这里构建的模型。 当然,这里我们自然使用Python的sklearn库来进行整个项目的实现,但是,它并不意味只能使用python,其他语言请自行修改。。。您所需要的只是一台笔记本电脑,能够使用docker创建一个python机器学习的环境包就好。这里将涉及一些必要的机器学习主题,但是我将尽力使它们变得清晰,并为感兴趣的人提供更多的学习资源。

……

阅读全文

python3解决LeeCode中等题编号468. 验证IP地址

这是一篇解析编程练习网站LeeCode上面的一道题的文章。 题目地址:力扣 分为几步:

  • 题目内容
  • 官方示例
  • 思路解析和 解题方法

题目内容

  1. 验证IP地址

编写一个函数来验证输入的字符串是否是有效的 IPv4 或 IPv6 地址。

IPv4 地址由十进制数和点来表示,每个地址包含4个十进制数,其范围为 0 - 255, 用(".")分割。比如,172.16.254.1; 同时,IPv4 地址内的数不会以 0 开头。比如,地址 172.16.254.01 是不合法的。

……

阅读全文

计算基尼系数和matplotlib绘制洛伦兹曲线

基尼系数和洛伦兹曲线,在表示数据的不平均方面特别是财富的不平均上被广泛应用。但是目前在python里面并没有找到很好的可以直接绘制洛伦兹曲线的函数,由于目前项目用到,也就在实际应用中使用到,就把如何使用numpy,pandas,matplotlib等包来计算基尼系数和绘制洛伦兹曲线的过程记录下来。方便大家遇到相似问题直接使用就可。

……

阅读全文

使用folium绘制新冠肺炎COVID-19疫情地图

在中国得到遏制后,新冠病毒造成的疫情在全球范围内越来越严重。为抵抗疫情,各国及地区都公布了每天新感染人数和死亡人数,为全球抗议提供有效帮助。为了可视化疫情数据,方便大家了解全球最新疫情,博主决定做一个使用万能工具python来绘制新冠肺炎全球疫情地图。 首先python绘图包很多,有metaplotlib,pandas,ploty等,他们在数据分析方面作用巨大,但是在绘制地图上面稍为有些欠缺,因此这里使用使用广泛的绘图工具folium,并保存结果为html。绘制疫情地图主要包含以下步骤:

……

阅读全文

python实现梯度下降在实际当中的应用

定义

梯度下降法(Gradient descent)是一个一阶最优化算法,通常也称为最陡下降法。 要使用梯度下降法找到一个函数的局部极小值,必须向函数上当前点对应梯度(或者是近似梯度)的反方向的规定步长距离点进行迭代搜索。如果相反地向梯度正方向迭代进行搜索,则会接近函数的局部极大值点;这个过程则被称为梯度上升法。

……

阅读全文

统计学偏态分布显示生活中的统计陷阱

90%的司机认为自己的驾驶水平高于平均水平,90%的人认为自己比人群平均智商要高,而关键是这都是可能符合真实数据的,确实是真实的,并没有造假,然后就认为“哇,其他人在客观地评估自己方面很糟糕”。这时您应该想到的是如果我们使用均值,这听起来并不那么令人难以置信。假如数据分布严重倾斜,是左偏态或者右偏态的话,就会存在严重的误导作用。因为平均值经常会骗人。而很多人却总是使用平均数来骗人显示自己某方面的的优越性,这是不科学的,中位数才是正常情况下的一般水准。 我们来看一个实际例子说明平均数的不可靠,假设

……

阅读全文

thunder迅雷下载地址真实地址解析

经常下载视频游戏之类的同学们应该经常碰到thunder开头的迅雷下载地址,但是却经常由于版权问题不能下载,那么这里就普通下载url与迅雷下载地址转换进行说明。

例如我随便给一个下载地址是
https://www.bobobk.com/favicon.ico

1.普通地址转换为迅雷地址

1.1在原地址前面加”AA”,后面加”ZZ”,地址变为AAhttps://www.bobobk.com/favicon.icoZZ

1.2此地址base64编码为

QUFodHRwczovL3d3dy5ib2JvYmsuY29tL2Zhdmljb24uaWNvWlo=

1.3迅雷专链即在上地址前加thunder://,即

thunder://QUFodHRwczovL3d3dy5ib2JvYmsuY29tL2Zhdmljb24uaWNvWlo=

转换代码

import base64
    def convert_to_thunder(s):
        s1  = "AA"+s+"ZZ"
        s2 = base64.b64encode(s1.encode())
        s3 = "thunder://" + s2.decode()
        return s3
normal_url  = 'https://www.bobobk.com/favicon.ico'
print(convert_to_thunder(normal_url))

《thunder迅雷下载地址真实地址解析》
2.迅雷地址转换为普通地址

2.1在原地址前去掉上”thunder://”

地址变为
QUFodHRwczovL3d3dy5ib2JvYmsuY29tL2Zhdmljb24uaWNvWlo=

2.2此地址base64解编码为

AAhttps://www.bobobk.com/favicon.icoZZ

2.3前后分别去掉 AA和ZZ

https://www.bobobk.com/favicon.ico

……

阅读全文

最大回文字符串算法Manacher

在刷leetcode时有个求最长回文字符串的问题。

#官方题解提供了4中解决办法,分别是

1.暴力法, 2.动态规划, 3.中心扩展算法, 4.就是我们今天要介绍的Manacher方法。

在介绍算法之前,首先介绍一下什么是回文串,所谓回文串,简单来说就是正着读和反着读都是一样的字符串,比如”aba”,”上海自来水来自海上”等等,一个字符串的最长回文子串即为这个字符串的子串中,是回文串的最长的那个。

……

阅读全文

python查找两个数组公有值

生活中经常碰到需要获取两数组公有值,那么python如何优雅获取两个数组之间的公有值,这里提供多种简单实用方法。

1.使用set元组的 &

list1 = [1,2,3,4,5,6,7]
list2 = [1,3, 5, 7, 9]
set(list1) & set(list2)
#{1, 3, 5, 7}

2.使用set元组的intersection交集

list1 = [1,2,3,4,5,6,7]
list2 = [1,3, 5, 7, 9]
set(list1).intersection(list2)
#{1, 3, 5, 7}

3.暴力查询list元素是否在第二个list中

list1 = [1,2,3,4,5,6,7]
list2 = [1,3, 5, 7, 9]
[element for element in list1 if element in list2]
   # [1, 3, 5, 7]

4.实用set元组的减法

list1 = [1,2,3,4,5,6,7]
list2 = [1,3, 5, 7, 9]
set(list1) - (set(list1)-set(list2))
#{1, 3, 5, 7}
……

阅读全文

Seaborn绘制核密度曲线实例详解

在频率分布直方图中,当样本容量充分放大到极限时,组距极限缩短,这个时候频率直方图中的阶梯折线就会演变成一条光滑的曲线,这条曲线就称为总体的密度分布曲线。

这篇文章春江暮客将详细介绍如何使用python绘图库seaborn和panda里面的iris也就是鸢尾花卉数据集来绘制各种炫酷的密度曲线。

……

阅读全文

最近文章

分类

标签

友情链接

其它