一道来自字节跳动2019春招研发岗的算法题。

题目介绍

我叫王大锤,是一家出版社的编辑。我负责校对投稿来的英文稿件,这份工作非常烦人,因为每天都要去修正无数的拼写错误。但是,优秀的人总能在平凡的工作中发现真理。我发现一个发现拼写错误的捷径:

  1. 三个同样的字母连在一起,一定是拼写错误,去掉一个的就好啦:比如 helllo -> hello

  2. 两对一样的字母(AABB型)连在一起,一定是拼写错误,去掉第二对的一个字母就好啦:比如 helloo -> hello

  3. 上面的规则优先“从左到右”匹配,即如果是AABBCC,虽然AABB和BBCC都是错误拼写,应该优先考虑修复AABB,结果为AABCC

我特喵是个天才!我在蓝翔学过挖掘机和程序设计,按照这个原理写了一个自动校对器,工作效率从此起飞。用不了多久,我就会出任CEO,当上董事长,迎娶白富美,走上人生巅峰,想想都有点小激动呢!
万万没想到,我被开除了,临走时老板对我说: “做人做事要兢兢业业、勤勤恳恳、本本分分,人要是行,干一行行一行。一行行行行行;要是不行,干一行不行一行,一行不行行行不行。” 我现在整个人红红火火恍恍惚惚的……

请听题:请实现大锤的自动校对程序

数据范围:

1
1≤n≤50,每个用例的字符串长度满足 1≤l≤1000

时间限制:C/C++ 1秒,其他语言2秒
空间限制:C/C++ 32M,其他语言64M

输入描述:

第一行包括一个数字N,表示本次用例包括多少个待校验的字符串。

后面跟随N行,每行为一个待校验的字符串。
输出描述:
N行,每行包括一个被修复后的字符串。

示例1

1
2
3
4
5
6
7
输入例子:
2
helloo
wooooooow
输出例子:
hello
woow

示例2

1
2
3
输入例子:
1
nowcoder

解题思路

这道题要求我们根据特定规则修正字符串中的拼写错误。虽然不知道为什么背景描述了一大堆,但总的来说,具体规则如下:

  1. 三个相同字母连在一起:删除一个字母。
  2. 两对相同字母连在一起(AABB型):删除第二对的一个字母。
  3. 优先从左到右匹配:即如果是AABBCC,应该优先修复AABB,结果为AABCC。

当时自己的一个反应是使用栈来处理。 遍历字符串时,逐个字符入栈并进行判断:

  • 如果栈顶元素与当前字符相同且栈顶元素的前一个字符也相同,则说明当前字符与栈顶的两个字符构成了三个相同字母,则删除该字符(也就是该字符不入栈)。
  • 如果栈顶元素与当前字符相同且栈顶元素的前一个字符不同,则说明当前字符与栈顶的两个字符构成了AABB型,需删除该字符(也就是该字符不入栈)。
  • 否则,将当前字符入栈。
  • 最后当整个栈的字符重新组合为新的字符串即可。

Coding

先在 main 里做一下读取输入输出的操作:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

func format_str(origin_str string) string {
if len(origin_str) < 3 {
return origin_str
}

// TODO

return ""
}

func main() {
x := 0
if n, err := fmt.Scan(&x); err == nil && n == 1 {
str_tmp := ""
for i := 0; i < x; i++ {
n, _ := fmt.Scan(&str_tmp)
if n == 0 {
break
}

result := format_str(str_tmp)
fmt.Printf(result)
}
}
}

习惯上,我会将栈的操作封装为一个结构体,这样可以更好的管理栈的操作。这里我使用了 interface{} 来实现泛型,这样可以存储任意类型的数据。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
type Stack []interface{}

func (s *Stack) Pop() (interface{}, error) {
if len(*s) == 0 {
return nil, fmt.Errorf("Stack is empty")
}

idx := len(*s) - 1
result := (*s)[idx]
*s = (*s)[:idx]
return result, nil
}

func (s *Stack) Push(element interface{}) {
*s = append(*s, element)
}

func (s *Stack) ToString() string {
result := ""
for _, v := range *s {
result += fmt.Sprintf("%c", v)
}

return result
}

然后在 format_str 函数中实现具体的逻辑:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
func format_str(origin_str string) string {
if len(origin_str) < 3 {
return origin_str
}

var stack Stack
for i := 0; i < len(origin_str); i++ {
if len(stack) >= 2 {
stack_len := len(stack)
if stack[stack_len-1] == stack[stack_len-2] && stack[stack_len-2] == origin_str[i] {
continue
}
if len(stack) >= 3 && stack[stack_len-1] == origin_str[i] && stack[stack_len-2] == stack[stack_len-3] {
continue
}
}
stack.Push(origin_str[i])
}

return stack.ToString()
}

总结

这道题目的难度不大,主要是对栈的操作。在实现的过程中,我发现了一个问题,就是在判断 AABB 的时候,我使用了 stack[stack_len-2] == stack[stack_len-3] 来判断,这样会导致当栈的长度小于 3 时会出现数组越界的问题。所以在判断 AABB 的时候,需要先判断栈的长度是否大于等于 3。