Golang实例001

2024-08-30 14:58
文章标签 golang 实例 001

本文主要是介绍Golang实例001,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Part 01 目标

    对日志文件进行过滤,拆分;

Part 02 了解与思路

    这是实习公司派给我的任务,在我快要淡出鸟的时候。有几份日志文件,很大的,以G为单位的。里面很多不必要的信息,需要过滤掉。另外,日志是记录在一起的,分析起来的时候,没有条理性,所以,要求根据日期,进行拆分,同一天的日志为一个文件,以日期命名,文件。
编程的重点是正则表达式的使用和文件操作

Part 03 来几行瞧瞧

    因为需要构造正则,所以得知道文件的格式。直接打开文件是个不明智的选择,对我而言,准确点,对我的电脑来说,打开大文件,我的小本本承受不了这样的负担。在Linux环境中,其实一条命令就可以了:

head -n 100 # 显示前面100行;
tail -n 100 # 显示最后100行;
sed -n '5,10p' filename # 这样可以只查看文件的第5行到第10行;

    是不是很方便。但是,我想练习一下golang,所以花了点时间,写了个小程序:


// Auth:Reluxer
// Time:2015-07-23
// Name:preview.go
// Description:闲得慌,写了两个函数
package main
import ("bufio""fmt""io""os"
)
const (ViewLineNum = 40
)
func ReadFileByLine002(filename string) error {f, err := os.OpenFile(filename, os.O_RDONLY, 0660)if err != nil {return err}defer f.Close()sc := bufio.NewScanner(f)for i := 0; i < ViewLineNum; i++ {sc.Scan()fmt.Println(sc.Text())}return sc.Err()
}
func ReadFileByLine001(filename string) error {f, err := os.Open(filename)if err != nil {return err}defer f.Close()buf := bufio.NewReader(f)for i := 0; i < ViewLineNum; i++ {line, err := buf.ReadString('\n')if err != nil {if err == io.EOF {fmt.Println("EOF")break}return err}fmt.Print(line)}return nil
}
func main() {filename := os.Args[1]err := ReadFileByLine002(filename)if err != nil {fmt.Println(err)}
}

    这样之后,我看到了文件的格式是这样的:

10.88.111.101 - - [18/Jul/2015:00:00:02 +0800] "GET /topics/2014-11-18/2269791.html HTTP/1.1" 200 15571
10.88.111.101 - - [18/Jul/2015:00:00:02 +0800] "GET /topics/2014-12-26/2419017.html HTTP/1.1" 200 15176
10.88.111.101 - - [18/Jul/2015:00:00:03 +0800] "GET /topics/2012-10-18/3535945.html HTTP/1.1" 200 15250
10.88.111.101 - - [18/Jul/2015:00:00:03 +0800] "GET /topics/2014-11-10/2245185.html HTTP/1.1" 200 15250

Part 04 过滤吧

    知道了文件格式,接下来就是过滤掉冗杂的日志,主要是.css,.js,.jpg,.png,.gif。这部分的代码如下:

package main
import ("bufio""fmt""io""os""regexp"
)
const (RegRuler = `(\.js HTTP)|(\.jpg HTTP)|(\.png HTTP)|(\.css HTTP)|(\.gif HTTP)`
)
func Process(filesrc, fielestore string) error {var fsrc, fdes *os.Filevar err errorfsrc, err = os.OpenFile(filesrc, os.O_RDONLY, 0660)if err != nil {return err}defer fsrc.Close()if fdes, err = os.OpenFile(fielestore, os.O_WRONLY|os.O_CREATE|os.O_TRUNC, 0666); err != nil {return err}defer fdes.Close()sc := bufio.NewScanner(fsrc)reg := regexp.MustCompile(RegRuler)for sc.Scan() {line := sc.Text()match := reg.FindString(line)if match == "" {if _, err = io.WriteString(fdes, line+"\n"); err != nil {return err}}}return sc.Err()return nil
}
func main() {filename := os.Args[1]filestorename := "no-css-jpg-png-gif-js_log"if err := Process(filename, filestorename); err != nil {fmt.Println(err)return}fmt.Println("ok")
}

    让我没想到的是,程序的运行时间超级长,长的我看了一集花千骨,它还没结束。
    另外,这一步在Linux底下,也是敲一敲命令就完工的事情。Linux真是强大到没边了。

Part 05 拆分,时间是标准

    光是这样,文件还是太大,而且没有条理,所以啊,要按照时间来拆分文件。那好吧,你说拆分就拆分喽,我没意见。
    代码如下:

package main
import ("bufio""fmt""io""os"// "path""regexp"
)
const (RegRuler = `\[(?P<day>\d{2})/(?P<month>[A-Za-z]{3})/(?P<year>\d{4}):\d{2}:\d{2}:\d{2}\s\+\d{4}\]`
)
func Process(filesrc string) error {var fsrc, fdes *os.Filevar err errorpremonth := ""preday := ""preyear := ""curmonth := ""curday := ""curyear := ""filedes := ""fsrc, err = os.OpenFile(filesrc, os.O_RDONLY, 0660)if err != nil {return err}defer fsrc.Close()sc := bufio.NewScanner(fsrc)reg := regexp.MustCompile(RegRuler)for sc.Scan() {line := sc.Text()// fmt.Println(line)match := reg.FindStringSubmatch(line)// fmt.Println(match)// if match == nil {//  if curday == "" && curmonth == "" && curyear == "" {//      if fdes, err = os.OpenFile("unkonow.txt", os.O_WRONLY|os.O_CREATE|os.O_APPEND, 0666); err != nil {//          return err//      }//  }// fmt.Println("here")// } else {if match != nil {for i, name := range reg.SubexpNames() {//Ignore the whole regexp match and unnamed groupsif i == 0 || name == "" {continue}switch name {case "month":curmonth = match[i]case "day":curday = match[i]case "year":curyear = match[i]}}// fmt.Println(filedes)if curday != preday || curmonth != premonth || curyear != preyear {fdes.Close()filedes = curyear + "-" + curmonth + "-" + curdayif fdes, err = os.OpenFile(filedes, os.O_WRONLY|os.O_CREATE|os.O_APPEND, 0666); err != nil {return err}}}_, err = io.WriteString(fdes, line+"\n")if err != nil {// fmt.Println("here")fdes.Close()return err}preyear = curyearpreday = curdaypremonth = curmonth// match :=//fmt.Fprintf(os.Stdout,"%s\n",scanner.Text())}fdes.Close()return sc.Err()return nil
}
func main() {filename := os.Args[1]// fmt.Println(filename)// err := ReadFileByLine001(filename)err := Process(filename)if err != nil {fmt.Println(err)}fmt.Println("ok")
}

Part 06 结束吧

    到这儿呢,基本就差不多了。该结束了。说一下,感慨。

  • 之前的代码少些了几行,然后,我的小本本就承受不住,主板过热,自动关机了,真的是吓死爹了。
  • 编程的过程都是一边百度,一边码代码,也算是小有收获。
  • 学语言就得实践,在实践中学习。

这篇关于Golang实例001的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1121142

相关文章

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

C++操作符重载实例(独立函数)

C++操作符重载实例,我们把坐标值CVector的加法进行重载,计算c3=c1+c2时,也就是计算x3=x1+x2,y3=y1+y2,今天我们以独立函数的方式重载操作符+(加号),以下是C++代码: c1802.cpp源代码: D:\YcjWork\CppTour>vim c1802.cpp #include <iostream>using namespace std;/*** 以独立函数

实例:如何统计当前主机的连接状态和连接数

统计当前主机的连接状态和连接数 在 Linux 中,可使用 ss 命令来查看主机的网络连接状态。以下是统计当前主机连接状态和连接主机数量的具体操作。 1. 统计当前主机的连接状态 使用 ss 命令结合 grep、cut、sort 和 uniq 命令来统计当前主机的 TCP 连接状态。 ss -nta | grep -v '^State' | cut -d " " -f 1 | sort |

Java Websocket实例【服务端与客户端实现全双工通讯】

Java Websocket实例【服务端与客户端实现全双工通讯】 现很多网站为了实现即时通讯,所用的技术都是轮询(polling)。轮询是在特定的的时间间隔(如每1秒),由浏览器对服务器发 出HTTP request,然后由服务器返回最新的数据给客服端的浏览器。这种传统的HTTP request 的模式带来很明显的缺点 – 浏 览器需要不断的向服务器发出请求,然而HTTP

828华为云征文|华为云Flexus X实例docker部署rancher并构建k8s集群

828华为云征文|华为云Flexus X实例docker部署rancher并构建k8s集群 华为云最近正在举办828 B2B企业节,Flexus X实例的促销力度非常大,特别适合那些对算力性能有高要求的小伙伴。如果你有自建MySQL、Redis、Nginx等服务的需求,一定不要错过这个机会。赶紧去看看吧! 什么是华为云Flexus X实例 华为云Flexus X实例云服务是新一代开箱即用、体

Golang进程权限调度包runtime

关于 runtime 包几个方法: Gosched:让当前线程让出 cpu 以让其它线程运行,它不会挂起当前线程,因此当前线程未来会继续执行GOMAXPROCS:设置最大的可同时使用的 CPU 核数Goexit:退出当前 goroutine(但是defer语句会照常执行)NumGoroutine:返回正在执行和排队的任务总数GOOS:目标操作系统NumCPU:返回当前系统的 CPU 核数量 p

Golang 网络爬虫框架gocolly/colly(五)

gcocolly+goquery可以非常好地抓取HTML页面中的数据,但碰到页面是由Javascript动态生成时,用goquery就显得捉襟见肘了。解决方法有很多种: 一,最笨拙但有效的方法是字符串处理,go语言string底层对应字节数组,复制任何长度的字符串的开销都很低廉,搜索性能比较高; 二,利用正则表达式,要提取的数据往往有明显的特征,所以正则表达式写起来比较简单,不必非常严谨; 三,使

Golang网络爬虫框架gocolly/colly(四)

爬虫靠演技,表演得越像浏览器,抓取数据越容易,这是我多年爬虫经验的感悟。回顾下个人的爬虫经历,共分三个阶段:第一阶段,09年左右开始接触爬虫,那时由于项目需要,要访问各大国际社交网站,Facebook,myspace,filcker,youtube等等,国际上叫得上名字的社交网站都爬过,大部分网站提供restful api,有些功能没有api,就只能用http抓包工具分析协议,自己爬;国内的优酷、

Golang网络爬虫框架gocolly/colly(三)

熟悉了《Golang 网络爬虫框架gocolly/colly 一》和《Golang 网络爬虫框架gocolly/colly 二》之后就可以在网络上爬取大部分数据了。本文接下来将爬取中证指数有限公司提供的行业市盈率。(http://www.csindex.com.cn/zh-CN/downloads/industry-price-earnings-ratio) 定义数据结构体: type Zhj

Golang支持平滑升级的HTTP服务

前段时间用Golang在做一个HTTP的接口,因编译型语言的特性,修改了代码需要重新编译可执行文件,关闭正在运行的老程序,并启动新程序。对于访问量较大的面向用户的产品,关闭、重启的过程中势必会出现无法访问的情况,从而影响用户体验。 使用Golang的系统包开发HTTP服务,是无法支持平滑升级(优雅重启)的,本文将探讨如何解决该问题。 一、平滑升级(优雅重启)的一般思路 一般情况下,要实现平滑